开源是酝酿革命性软件的沃土,尤其是在人工智能和机器学习等前沿领域。开源精神和协作工具使团队更容易共享代码和数据,并在别人成功的基础上再接再厉。
本文介绍了13个重塑人工智能和机器学习界的开源项目。一些是支持新算法的复杂软件包,另一些比较低调。所有这些都值得留意。
缺少TensorFlow和PyTorch的AI和机器学习开源工具列表是不完整的。这些框架单独或共同支持机器学习和人工智能领域一些最具实验性、最重要的研究。本文讨论的至少几个项目将它们用作基础模块。
编程方面需要一点帮助的程序员可以得益于FauxPilot。该系统拿现有的生产代码训练自己,并从中学习到足够的知识,提出有意义的评论和建议。项目的灵感来自GitHub Copilot,但FauxPilot让您可以选择用于训练的代码库。这额外的控制层可防止您从可能不批准使用的来源使用代码片段。如果您选择训练来源,并仅限拥有适当权限和许可证的人使用,那么您使用的编程帮助和代码片段更有可能是干净可靠的。
了解机器学习模型如何“思考”的最简单方法之一是,开始将单词馈入DALL-E,这个非常大的开放模型用从网上收集的图像和文本描述构建而成。输入一个单词,出来DALL-E认为匹配的图像。DALL-E
Playground和DALL-E Mini等开源项目使用户更容易试验模型。它部分是游戏,部分是窥视AI算法底层的门户。
实时对象检测(查找图像中的对象)是人工智能的一个棘手领域。它对于需要收集和传送准确环境信息的自动驾驶汽车、机器人和辅助设备等领域也至关重要。YOLOv7是最快、最准确的开源对象检测工具之一。只需为该工具提供一堆对象丰富的图像,然后看看接下来会发生什么。
深度伪造是借助深度学习创建、改动或合成的视频和图像。最常见的例子是将名人或政客的脸换成现有的视频或图像,通常是为了好玩,但有时出于更邪恶的目的。DeepFaceLab是在Python上运行的开源深度伪造技术。除了将一张脸换成另一张脸外,它还可以用来去除皱纹及其他表明年迈的标记。
自然语言处理(NLP)引擎执行神经搜索和情感分析,然后为人类和机器用户提取和呈现信息。虽然有时仍然很笨拙,但这项技术已变得足够先进,可以用于各种应用环境和领域(Alexa只是一个例子)。PaddleNLP是一个流行的开源NLP库,您可以用它来收集搜索情绪,并标记重要实体。
AI的传统成功途径是将数据存储在数据库中,然后将其提取、发送给一种另外的机器学习算法。MindsDB是一种SQL服务器,将机器学习算法直接集成到数据库中。数据库内机器学习(即在已经存储数据的地方分析数据)是加快机器学习工作流程的一种快速有效的方法。
Image
Super-Resolution(ISR)
照片的细节总是越多越好,而Image Super-Resolution可以通过提高图像分辨率来添加更多细节。这个开源工具采用机器学习模型,您可以训练该模型,以猜测低分辨率图像中的细节。借助良好的训练集,该模型可以生成准确的细节和更清晰的图像。
许多企业和大公司正在把客户服务一线员工换成聊天机器人,这意味着机器在学习进行对话。DeepPavlov将TensorFlow、Keras和PyTorch等基本的机器学习工具结合在一起,创建聊天机器人供您学习。结果有点古怪,但借助合适的训练,有时结果很实用。
将3D模型转换成华丽渲染场景的好方法是启动Blender。虽然许多人认为Blender是电影制作人和动画师手里的工具,它也是应用型AI的一个典例。丰富的界面和众多插件使创建复杂的动态图形或电影场景成为可能。只需要一点创造力,奥斯卡提名委员会很快就会打来电话。AI甚至不会要求分享胜利果实。
探索机器视觉的最可靠基础之一是开源计算机视觉库OpenCV。它包括许多用于识别数字图像中对象的流行算法,以及专门的例程,比如可以识别和读取汽车牌照的例程。
Robocode对您的算法而言如同《饥饿游戏》。这款基于Java的编程游戏让您的坦克可以在争夺统治权的战斗中与其他坦克作战。这是一种有趣的消遣,甚至可能有助于测试自动驾驶汽车的新策略。
原文链接:
https://www.infoworld.com/article/3673976/13-open-source-projects-transforming-ai-and-machine-learning.html
由于公众号平台改变了推送规则,如果你想多看到我们的文章,记得点一下在看和星标哦~
文章评论