分享

机器学习/人工智能开源项目整理<一>

 netouch 2023-05-18 发布于北京
nimated Drawings一款很有趣的 AI 工具,可以借助人工智能技术,让儿童绘画作品动起来。1VNNYY 开源的一款高性能、轻量级神经网络部署框架,可将真实人脸快速转换为迪士尼、3D 游戏、油画画像风格的人脸外形,并提供了适配多场景的目标检测、物品分割、对象识别等功能。2MotionPlanning来自华为的自动驾驶算法工程师,在 GitHub 开源了一个运动规划算法,里面实现了各类自动驾驶汽车上常用的路径规划 路径跟踪算法。3「NÜWA(女娲)」微软与北京大学联手,在 GitHub 开源了一个多模态预训练模型,可实现文本/草图转图像、图像补全、文字/草图转视频等任务,功能异常强大。4Qlib一个 AI 量化交易平台,旨在寻求与挖掘 AI 技术在量化投资领域中的价值。里面包含数据处理、模型训练、回溯测试的完整 ML 管道,并且覆盖了量化投资的整个链条:Alpha 探索、风险建模、投资组合优化和交易执行等功能。5abstreet项目可通过软件来模拟街道和十字路口的交通流量,以规划各类车辆的运行网络,进一步改善交通状况。6Eiten国外一家热衷于用 AI 与数据分析来做投资分析的企业 Tradytics,在 GitHub 开源的内部工具包,里面主要实现了各种统计与算法投资策略,如最小方差、最大夏普比率和基于遗传算法的投资组合,对这块技术感兴趣的同学可以看下。7face2comics外国一位名为 Alex 的开发者整理的人脸转漫画数据集,数据集拥有两个版本,v1 主要为深色调(含 1 万张图片),v2 为深红色调(含 2 万张图片)。漫画风格偏欧美风,可用于训练 pix2pix 或相似网络8KalidoKit来自纽约的开发者 Richard Yee 做了一款人体运动模拟器,通过捕捉人体面部表情、眼睛、姿势、手部动作等元素后,便可自动映射到虚拟人物身上,打通真实世界与虚拟世界的连接。9Simula为了推进 VR 与 AR 技术在 Linux 系统上的应用,国外一家名为 SimulaVR 的机构打造了一款 Linux VR 桌面窗口管理器10AnimeGANv2-PyTorc可借助 AI 技术,快速将图像转换为漫画风格画作,提供 Demo 试用。11WantWords清华大学 NLP 实验室在 GitHub 开源的 WantWords(万词王)词典还蛮有意思的。通过指定词义,便可匹配与之描述相近的词汇。比如,当你输入「开心的词」,该工具便会给出 '快乐'、'愉快'、'高兴' 等词汇。12Mini Pupper一个开源的机器狗,带有激光雷达、相机传感器,整体成本不到 500 美元。13Lite.AI.ToolKit一款开箱即用的 C AI 模型工具箱,涵盖目标检测、人脸检测、人脸识别、语义分割、抠图等领域。14HandPose X国内一位开发者在 GitHub 上开源的手势识别项目,支持手部 21 个关键点检测、二维手势姿态、手势识别等功能。15invoice一个开源的增值税发票 OCR 识别项目,可通过 API 接口,快速识别发票代码、发票号码、开票日期、校验码、税后金额等内容。16PSGAN北航与国科大在 2019 年与 GitHub 开源的一项技术,可通过生成对抗网络,快速实现妆容转移、一键上妆等功能。17AI-Writer可用 GPT 来生成中文网文小说,模型训练数据来自网文。项目内置基于 Python 运行的网页界面,并通过特殊采样方法,改善了小模型的生成质量。18ChainKnowledgeGraph国内一位开发者在 GitHub 开源的产业链图谱,主要包括 A 股上市公司、行业与产品共 3 类实体。19Lichee腾讯技术团队在 GitHub 开源的一款「多模态内容理解」算法框架,框架采用分层的思想组织模型训练流程,包含了数据处理、预训练模型、常见模型以及模型加速等模块。20MuJoCoDeepmind 前不久收购了知名物理引擎 MuJoCo,未来将用于机器人、生物学、图形动画、机器学习等领域,帮助开发者提升产品开发体验。21LaMa由莫斯科三星人工智能中心开源,可快速进行图像修复、指定对象移除等操作。22PathPlanning一个动画算法库,主要实现多种在机器人领域中,常用到的路径规划算法,其中也包括基于搜索与采样的方法。23Fast-Drone-250浙江大学 FASTLAB 实验室,在 GitHub 上开源了一套自主导航无人机的硬件组成与搭建方案。该项目可应用于无人机在未知环境中的自主飞行,集群飞行等场景。24Muzic微软最近在 GitHub 上开源了一个 AI 音乐项目,基于深度学习,可自动完成音乐创作。创作过程主要分为两步,一是音乐理解(符号分类、声音识别),二是音乐合成(歌曲歌词创作、音乐旋律生成)。25LAION-400-MILLION OPEN DATASET国外一家名为 Laion 的人工智能非盈利组织,开放了全球最大的图像文本对(image-text-pair)数据集,共提供了 4 亿样本数据。26RobustVideoMatting来自字节跳动的工程师在 GitHub 上开源了一项视频自动抠图技术,该技术引入了一种强大、实时、高分辨率的人物视频抠图方法,使用循环神经网络,在处理视频流时有时间记忆,可在任意视频上做实时高清抠像。27Kornia一款基于 PyTorch 的可微分的计算机视觉库。可训练模型来执行图像变换、对极几何、深度估计和低级图像处理。28Tangram(七巧板)一个可帮助 AI 开发者快速训练、部署与监控机器学习模型的开源工具。29DataCLUE国内首个以数据为中心的 AI 测评(含模型分析报告),可通过系统化改造数据来提升模型效果。30Real-time Stock-market作者尝试基于机器学习来进行股票市场预测。31PersonGraphDataSet一份开源的人物图谱数据集,收录了近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取 人工整理得出,可用于人物关系搜索、查询、人物关系多跳问答,以及人物关系推理等场景提供基础数据。32chineseocr_lite一款超轻量级中文 OCR,支持竖排文字识别,总模型仅 4.7M。33SZT-bigdata一个开源的深圳地铁大数据客流分析系统,主要通过分析深圳通刷卡数据,从大数据的技术角度来研究深圳地铁客运能力,探索深圳地铁优化服务的方向。34NARUTO-HandSignDetection一个开源项目,可用于识别火影忍者中的结印手势。35BIFROST给从事 AI 开发的同学分享个数据集搜索神器,该网站当前共计拥有 1900 个数据集,提供人物、自动驾驶汽车、零售、无人机等六大类别。36MLOps-Basics一个开源的 MLOps 基础教程,作者将通过 10 周的时间,带你了解 MLOps 的基础知识,如模型构建、监控、配置、测试、打包、部署、CI/CD(GitHub Actions)等内容。37CompreFace一款开源的人脸识别与检测系统,不懂机器学习技术亦可使用。38pix2tex一款开源的 LaTeX 代码识别系统,基于深度学习技术,快速识别数学公式的图像,并返回相应的 LaTeX 代码。39Realtime-Voice-Clone-Chinese一个基于深度学习的中文语音合成项目,通过采集分析一段具体的声音样本,可在 5 秒内生成与之类似的克隆语音。40AI_Tutorial一个开源的 AI 学习资料库,主要整理了人工智能、机器学习、深度学习、搜索系统、推荐系统、广告系统等领域的学习资料。41Polaris一款开源的人脸考勤系统,集成了脸部识别技术,拥有颇具未来感的设计风格,可用于尝鲜。42neural_network_papers一份开源的 AI 论文笔记,主要记录作者读过的一些论文,给出个人对论文的评分情况并简述论文 insight。43NLPDataSet国内一名开发者在 GitHub 开源了常用数据集,主要将多个网络数据集进行整理清洗,并将格式统一化。其主要目的,在于构建一个较完善的中文片段抽取式阅读理解数据集。44Lite.AI一个比较丰富的 C 库,里面收录了 60 多个实用的 AI 模型,其中包含对象检测、人脸检测、风格迁移、人脸识别、图像分割、图像分类等类别。45AiLearning-Theory-Applying一个 AI 知识库,帮助开发者快速上手 AI 理论及应用实战:基础知识、机器学习、深度学习、自然语言处理 BERT,含大量注释及数据集,力求每一位能看懂并复现。46NLPer-Arsenal一个 NLP 开源知识库,主要收录 NLP 竞赛经验贴、通用工具、学习资料等内容,覆盖文本分类、机器翻译、语义解析、实体识别等类别。47DouZero一个 AI 斗地主项目,基于深度学习与深度蒙特卡罗(DMC)算法构建,尝试让 AI 与人类博弈。48

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多