开发人员亲自上场:Julia语言搞机器学习和Python比,哪个好用?

WBOY
发布: 2023-04-11 12:28:02
转载
1381人浏览过

 

2022 年,你会选择哪种编程语言呢?

前几年就流传着这样一种说法:Julia会替代 Python,成为新的最受欢迎的编程语言之一。我们暂且对这种说法持观望态度,但作为科学计算方面的强大工具,Julia优势已然显现,这意味着程序员的选择又多了一种。

在数据科学、人工智能等领域,仔细对比Julia和 Python,我们会发现:相同的任务,只要 Python 能实现的的,Julia都可以做,而且效率高得多,语法也简洁优雅,只是在传播度上,名气还不如 Python。

近日,reddit 上的一则热帖引来广大网友的讨论,这个帖子提到,最近,一些Julia语言包的开发人员讨论了Julia中 ML 的当前状态,并将其状态与 Python ML 生态系统进行了比较。

原贴地址:

立即学习Python免费学习笔记(深入)”;

https://www.reddit.com/r/MachineLearning/comments/s1zj44/r_julia_developers_discuss_the_current_state_of/

来自乌得勒支大学的 JordiBolibar 认为,「Julia确实在机器学习方面拥有巨大的潜力,但它目前的状态有点喜忧参半。更具体地说,我在 SciML 中坚持使用Julia的主要原因是,DifferentialEquations.jl 库工作得非常好,但在 Python 中没有发现任何类似的东西。然而,对于我的研究来说,真正痛苦的是 AD 部分。自从我开始使用Julia,我在 Zygote 中遇到了两个错误,这使我的工作速度减慢了几个月。但我仍然认为Julia是 SciML 的最佳选择,但这些库(及其文档)应该优化的更加用户友好。」

网友 @jgreener64 表示:「Julia中的 ML 在某些领域应用非常强大,Julia一切皆有可能。Julia面临的问题是:Julia中的 ML 需要大量现有知识或大量时间搜索 / 反复试验。在个人层面上,我目前正在用Julia开发新颖的可微分算法。」

除了网友的热烈讨论外,Julia软件包开发人员 Christopher Rackauckas 围绕以下 7 个问题,解答了网友比较关心的内容。Rackauckas 是 MIT 和马里兰大学的数学家和药理学家,主要用Julia进行编程。Rackauckas 为Julia、数学和随机生物学开了专门博客,来介绍相关内容,并且 Rackauckas 在Julia中开发了一些库,包括(但不限于)DifferentialEquations.jl 和 Pumas。

Christopher Rackauckas

问题包括:

  1. 今天Julia中的 ML 在哪些地方真正大放异彩?在不久的将来该生态系统在哪些方面优于其他流行的 ML 框架(例如 PyTorch、Flax 等),为什么?

  2. 目前Julia的 ML 生态系统在功能或性能方面存在哪些缺点?Julia在这些领域变得具有竞争力的时间节点在哪?

  3. Julia的标准 ML 包(例如深度学习) 在性能方面与流行的替代方案相比如何(更快、更慢、相同数量级)?

    码上飞
    码上飞

    码上飞(CodeFlying) 是一款AI自动化开发平台,通过自然语言描述即可自动生成完整应用程序。

    码上飞 138
    查看详情 码上飞
  4. 有没有重要的Julia实验,可以针对流行的 ML 替代方案进行基准测试?

  5. 如果一家公司或机构正在考虑创建职位来为Julia的 ML 生态系统做出贡献,有没有最佳案例?为什么他们应该这样做?哪些贡献最有影响力?

  6. 为什么与其他框架合作的独立开发人员应该考虑为Julia的 ML 生态系统做出贡献?

  7. 对于某些特定任务,Julia开发人员倾向于使用哪些软件包?Julia开发人员希望添加目前不存在的哪些内容?

下文中我们挑选了几个大家比较关心的问题进行报道:

问题 3:Julia在「标准 ML」中的表现如何?

Julia的内核速度很好:在 CPU 上,我们做得非常好,在 GPU 上,每个人都只是调用相同的 cudnn 等;Julia的 AD 速度也很好。不过 Zygote 可能会有一些开销,但与 Jax/PyTorch/TensorFlow相比,Zygote 在大多数情况下速度是很快的。具体来说,PyTorch 开销要高得多,在标准 ML 工作流程中甚至无法测量。一个足够大的矩阵乘法会解决分配问题或其他 O(n) 问题;Julia不融合内核,因此在大多数基准测试中,如果用户查看它,就会发现它没有融合 conv 或 RNN cudnn 调用。

问题 4:我们应该跟踪哪些重要的实验和基准?

XLA 的分布式调度器非常好。当我们考虑扩展时,我们应该忽略 PyTorch,去考虑 DaggerFlux 与TensorFlow/Jax。XLA 有更多的灵活性来改变操作,所以我认为 XLA 才是赢家,我们需要使用 e-graphs 技巧来匹配它。另一件需要注意的事情就是「自动微分中缺少中间部分」,这种情况还需要解决。

问题 7:有什么推荐的软件包?

我倾向于在需要时使用 Flux,但大家还是尽量使用 DiffEqFlux。就现有内核而言,Flux 是最完整的,但它的风格让我感到厌烦。我希望有一个 Flux 不使用隐式参数,而是使用显式参数。我希望这些参数由 ComponentArrays 表示。

 

以上就是开发人员亲自上场:Julia语言搞机器学习和Python比,哪个好用?的详细内容,更多请关注php中文网其它相关文章!

python速学教程(入门到精通)
python速学教程(入门到精通)

python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:51CTO.COM网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号