我滴个神 ~~ 这是怎么做到的?Modin 有自带的 modin.pandas.DataFrame 对象,这是一个轻量级的并行 DataFrame 对象 。因为与 Pandas API 兼容,使用这个对象就跟是透明的一样,在后台,该支持库使用 Ray 或 Dask 作为计算引擎,执行分布式数据计算 。
有的时候,获得更快的速度就是那么简单,改一两行代码就可以了,Modin 就是证明 。
7. Streamlit

文章插图
项目网址:
https://github.com/streamlit/streamlit
不论机器学习项目多么的超凡脱俗,都免不了要手动与模型和数据交互的工作 。
与其投入无数小时,开发数千行代码的应用,Streamlit 让你可以快速搭建用来分享模型与分析的 App 。构建交互式 UI、实现数据可视化、输出分析模型现在就是小菜一碟 。
有了 Streamlit,只要添加几行代码,嗖的一下,就能从 Python 脚本代码飞升为产品级 APP 。TensorFlow、Keras、PyTorch、Pandas,只要是你能想到的数据科学工具,Streamlit 都已经支持了 。
8. Transformers

文章插图
项目网址:
https://github.com/huggingface/transformers
从事机器学习相关工作的读者,一定会对过去的一年中自然语言处理(NLP)领域里的重大突破有所耳闻 。
BERT、XLNet、roBERTa 等新涌现出来的高性能模型已经取得了长足的发展,尤其是在文本分类、机器翻译、命名实体识别等众多 NLP 领域里的高精尖突破层出不穷,让人眼花缭乱 。
对业界人士来说,找到一款既能在产品级程序上利用这些模型,又不会太过复杂的工具,尤为重要 。对研究者而言,一个既不用花费太多时间编写模板代码,又能调校支持库内核,不断开发、实验新模型的支持库,也非常重要 。
Hugging Face 的小伙伴给我们带来了变形金刚(Transformers),这个支持库支持最现代的 NLP 模型打包、预训练等功能,而且还开箱即用 。TensorFlow 2.0 与 PyTorch 之间的互操作,让该支持库达到了业界标准,完全可以为研究工作与产品级应用程序加持 。该支持库由研究人员开发,因此,它的更新速度非常快,而且还在不断引入新式模型 。
锦上添花:Hugging Face 团队开发了 DistilBERT,这是基于 BERT 提炼出来的,更小、更快、更省钱、更轻量的版本 。
还在犹豫要不要用 Hugging Face 的变形金刚处理现代 NLP 任务?看到这篇文章就是缘分,快来试下这个在线演示,感受变形金刚的魔力吧 。

文章插图
9. Detectron2

文章插图
项目网址:
https://github.com/facebookresearch/detectron2
Facebook AI 研究团队(FAIR)在开发对象探知、姿态估测、语义/实例分隔、全景分割等模型的同时,不断将计算机视觉(CV)推向新的高度 。
就在短短的几年前,上述这些技术就像是科幻小说 。我们从未对 FAIR 有过什么期望,但这回他们再一次震撼全场 。
Detectron2 是 Detectron 的延续,该支持库建立在 PyTorch 之上,整合了多种高精尖的计算机视觉算法 。
鉴于支持用例类型多种多样,这类支持库的开发难度特别大 。与 Hugging Face 的 Transformers 类似,FAIR 团队的 Detectron2 真的很强大,其延展性与模块化的设计风格,让它在计算机视觉研究应用中独领风骚 。同时,Detectron2 的应用极其简单,非常适合那些只想快速得到结果,不想了解核心算法的人 。没错,只要几行 Python 代码,就可以通过 Detectron2 让你开发的软件“理解”图片 。
Detectron2 能否形成生机勃勃的社区,还需要些时间来验证,但到目前为止,它的前途还是蛮光明的 。很多研究人员都在为 Detectron2 研发更新、更快、更好的模型,因此,它成为计算机视觉应用“首选”解决方案的可能性很大 。如果你从事计算机视觉工作,一定要对这个支持库保持密切的关注!
10. Metaflow项目网址:
https://docs.metaflow.org/introduction/what-is-metaflow
Metaflow 这个支持库实在太新了,差点就没赶上 2019 年榜单评选!但不要因此就小瞧它:别看它 12 月 3 日才正式发布,其实它是 Netfilx 两年精雕细琢的成果,通过了长期内部实测,Netflix 才决定开源 。
Metaflow 这个 Python 支持库能帮助数据科学家与数据工程师开发在现实世界中应用的实战项目 。它的目标是,减轻非技术型数据科学家学习技术的负担,比如,如何利用计算资源、怎么实现并行运算、架构设计、版本控制等 。Netflix 与 AWS 合作,让用户通过开箱即用的分布式计算即可轻松定义复杂数据流 。
推荐阅读
- 世界那么大,何必用百度?搜索引擎汇总,总有一款适合你
- 劳斯莱斯欢庆女神和飞天女神 劳斯莱斯车标飞天女神
- 鲁山大佛是世界第一大佛吗 我国最大的大佛像是哪一座
- 普洱茶收藏应避开三大误区
- 茶企认可两岸斗茶新规 送来6斤上好大红袍
- 泡工夫茶创新电热茶炉 四年获五项国家专利
- 国际茶路沉寂百年悄然复兴
- 缙云县三溪乡,大学生村官带领村民共致富
- 养发护发方法大全
- 青少年蹲下站起膝盖响正常吗?
