机器学习/人工智能开源项目整理＜一＞

netouch 2023-05-18 发布于北京

展开全文

nimated Drawings一款很有趣的 AI 工具，可以借助人工智能技术，让儿童绘画作品动起来。1VNNYY 开源的一款高性能、轻量级神经网络部署框架，可将真实人脸快速转换为迪士尼、3D 游戏、油画画像风格的人脸外形，并提供了适配多场景的目标检测、物品分割、对象识别等功能。2MotionPlanning来自华为的自动驾驶算法工程师，在 GitHub 开源了一个运动规划算法，里面实现了各类自动驾驶汽车上常用的路径规划路径跟踪算法。3「NÜWA（女娲）」微软与北京大学联手，在 GitHub 开源了一个多模态预训练模型，可实现文本/草图转图像、图像补全、文字/草图转视频等任务，功能异常强大。4Qlib一个 AI 量化交易平台，旨在寻求与挖掘 AI 技术在量化投资领域中的价值。里面包含数据处理、模型训练、回溯测试的完整 ML 管道，并且覆盖了量化投资的整个链条：Alpha 探索、风险建模、投资组合优化和交易执行等功能。5abstreet项目可通过软件来模拟街道和十字路口的交通流量，以规划各类车辆的运行网络，进一步改善交通状况。6Eiten国外一家热衷于用 AI 与数据分析来做投资分析的企业 Tradytics，在 GitHub 开源的内部工具包，里面主要实现了各种统计与算法投资策略，如最小方差、最大夏普比率和基于遗传算法的投资组合，对这块技术感兴趣的同学可以看下。7face2comics外国一位名为 Alex 的开发者整理的人脸转漫画数据集，数据集拥有两个版本，v1 主要为深色调（含 1 万张图片），v2 为深红色调（含 2 万张图片）。漫画风格偏欧美风，可用于训练 pix2pix 或相似网络8KalidoKit来自纽约的开发者 Richard Yee 做了一款人体运动模拟器，通过捕捉人体面部表情、眼睛、姿势、手部动作等元素后，便可自动映射到虚拟人物身上，打通真实世界与虚拟世界的连接。9Simula为了推进 VR 与 AR 技术在 Linux 系统上的应用，国外一家名为 SimulaVR 的机构打造了一款 Linux VR 桌面窗口管理器10AnimeGANv2-PyTorc可借助 AI 技术，快速将图像转换为漫画风格画作，提供 Demo 试用。11WantWords清华大学 NLP 实验室在 GitHub 开源的 WantWords（万词王）词典还蛮有意思的。通过指定词义，便可匹配与之描述相近的词汇。比如，当你输入「开心的词」，该工具便会给出 '快乐'、'愉快'、'高兴' 等词汇。12Mini Pupper一个开源的机器狗，带有激光雷达、相机传感器，整体成本不到 500 美元。13Lite.AI.ToolKit一款开箱即用的 C AI 模型工具箱，涵盖目标检测、人脸检测、人脸识别、语义分割、抠图等领域。14HandPose X国内一位开发者在 GitHub 上开源的手势识别项目，支持手部 21 个关键点检测、二维手势姿态、手势识别等功能。15invoice一个开源的增值税发票 OCR 识别项目，可通过 API 接口，快速识别发票代码、发票号码、开票日期、校验码、税后金额等内容。16PSGAN北航与国科大在 2019 年与 GitHub 开源的一项技术，可通过生成对抗网络，快速实现妆容转移、一键上妆等功能。17AI-Writer可用 GPT 来生成中文网文小说，模型训练数据来自网文。项目内置基于 Python 运行的网页界面，并通过特殊采样方法，改善了小模型的生成质量。18ChainKnowledgeGraph国内一位开发者在 GitHub 开源的产业链图谱，主要包括 A 股上市公司、行业与产品共 3 类实体。19Lichee腾讯技术团队在 GitHub 开源的一款「多模态内容理解」算法框架，框架采用分层的思想组织模型训练流程，包含了数据处理、预训练模型、常见模型以及模型加速等模块。20MuJoCoDeepmind 前不久收购了知名物理引擎 MuJoCo，未来将用于机器人、生物学、图形动画、机器学习等领域，帮助开发者提升产品开发体验。21LaMa由莫斯科三星人工智能中心开源，可快速进行图像修复、指定对象移除等操作。22PathPlanning一个动画算法库，主要实现多种在机器人领域中，常用到的路径规划算法，其中也包括基于搜索与采样的方法。23Fast-Drone-250浙江大学 FASTLAB 实验室，在 GitHub 上开源了一套自主导航无人机的硬件组成与搭建方案。该项目可应用于无人机在未知环境中的自主飞行，集群飞行等场景。24Muzic微软最近在 GitHub 上开源了一个 AI 音乐项目，基于深度学习，可自动完成音乐创作。创作过程主要分为两步，一是音乐理解（符号分类、声音识别），二是音乐合成（歌曲歌词创作、音乐旋律生成）。25LAION-400-MILLION OPEN DATASET国外一家名为 Laion 的人工智能非盈利组织，开放了全球最大的图像文本对（image-text-pair）数据集，共提供了 4 亿样本数据。26RobustVideoMatting来自字节跳动的工程师在 GitHub 上开源了一项视频自动抠图技术，该技术引入了一种强大、实时、高分辨率的人物视频抠图方法，使用循环神经网络，在处理视频流时有时间记忆，可在任意视频上做实时高清抠像。27Kornia一款基于 PyTorch 的可微分的计算机视觉库。可训练模型来执行图像变换、对极几何、深度估计和低级图像处理。28Tangram（七巧板）一个可帮助 AI 开发者快速训练、部署与监控机器学习模型的开源工具。29DataCLUE国内首个以数据为中心的 AI 测评（含模型分析报告），可通过系统化改造数据来提升模型效果。30Real-time Stock-market作者尝试基于机器学习来进行股票市场预测。31PersonGraphDataSet一份开源的人物图谱数据集，收录了近十万的人物关系图谱事实数据库，通过人物关系抽取算法抽取人工整理得出，可用于人物关系搜索、查询、人物关系多跳问答，以及人物关系推理等场景提供基础数据。32chineseocr_lite一款超轻量级中文 OCR，支持竖排文字识别，总模型仅 4.7M。33SZT-bigdata一个开源的深圳地铁大数据客流分析系统，主要通过分析深圳通刷卡数据，从大数据的技术角度来研究深圳地铁客运能力，探索深圳地铁优化服务的方向。34NARUTO-HandSignDetection一个开源项目，可用于识别火影忍者中的结印手势。35BIFROST给从事 AI 开发的同学分享个数据集搜索神器，该网站当前共计拥有 1900 个数据集，提供人物、自动驾驶汽车、零售、无人机等六大类别。36MLOps-Basics一个开源的 MLOps 基础教程，作者将通过 10 周的时间，带你了解 MLOps 的基础知识，如模型构建、监控、配置、测试、打包、部署、CI/CD（GitHub Actions）等内容。37CompreFace一款开源的人脸识别与检测系统，不懂机器学习技术亦可使用。38pix2tex一款开源的 LaTeX 代码识别系统，基于深度学习技术，快速识别数学公式的图像，并返回相应的 LaTeX 代码。39Realtime-Voice-Clone-Chinese一个基于深度学习的中文语音合成项目，通过采集分析一段具体的声音样本，可在 5 秒内生成与之类似的克隆语音。40AI_Tutorial一个开源的 AI 学习资料库，主要整理了人工智能、机器学习、深度学习、搜索系统、推荐系统、广告系统等领域的学习资料。41Polaris一款开源的人脸考勤系统，集成了脸部识别技术，拥有颇具未来感的设计风格，可用于尝鲜。42neural_network_papers一份开源的 AI 论文笔记，主要记录作者读过的一些论文，给出个人对论文的评分情况并简述论文 insight。43NLPDataSet国内一名开发者在 GitHub 开源了常用数据集，主要将多个网络数据集进行整理清洗，并将格式统一化。其主要目的，在于构建一个较完善的中文片段抽取式阅读理解数据集。44Lite.AI一个比较丰富的 C 库，里面收录了 60 多个实用的 AI 模型，其中包含对象检测、人脸检测、风格迁移、人脸识别、图像分割、图像分类等类别。45AiLearning-Theory-Applying一个 AI 知识库，帮助开发者快速上手 AI 理论及应用实战：基础知识、机器学习、深度学习、自然语言处理 BERT，含大量注释及数据集，力求每一位能看懂并复现。46NLPer-Arsenal一个 NLP 开源知识库，主要收录 NLP 竞赛经验贴、通用工具、学习资料等内容，覆盖文本分类、机器翻译、语义解析、实体识别等类别。47DouZero一个 AI 斗地主项目，基于深度学习与深度蒙特卡罗（DMC）算法构建，尝试让 AI 与人类博弈。48