分享

推荐两个 永远的神 的开源项目!

 江海博览 2024-06-23 发布于浙江

本期推荐开源项目目录:

1. 一款支持90+语言的全能文档OCR工具包

2. 实时全身姿态估计工具


01

一款支持90+语言的全能文档OCR工具包

Surya 是一个功能强大的文档OCR工具包,由 VikParuchuri 开发。它不仅支持超过 90 种语言的光学字符识别(OCR),而且在与云服务的基准测试中表现优异。
Surya 能够进行线级文本检测、布局分析(如表格、图像、标题等的检测)以及阅读顺序的识别,适用于多种文档类型。
  • 多语言支持:Surya 支持90多种语言的OCR,使其成为一个真正的多语言解决方案。
  • 线级文本检测:能够识别任何语言的文本行。
  • 布局分析:可以检测文档中的表格、图像、标题等元素。
  • 阅读顺序检测:能够识别文本的阅读顺序,优化信息的获取。
Surya 还包括了一个基于Streamlit的交互式应用程序,允许用户以交互方式尝试对图像或PDF文件进行OCR。
Surya 的模型权重采用 cc-by-nc-sa-4.0 许可,但对于年收入或终身风险投资低于500万美元的组织免费。
开源地址:https://github.com/VikParuchuri/surya

支持中文

Image

排版
Image阅读顺序提取

Image

ocr 识别

Image

02

实时全身姿态估计工具

MusePose是由TMElyralab开发的一款开源的实时全身姿态估计工具。它利用最新的计算机视觉技术,能够在多种设备上实现高精度的人体姿态跟踪。
  • 实时性能:MusePose能够在实时环境中准确估计人体姿态。
  • 全身追踪:支持从头到脚的全身关键点检测。
  • 多平台兼容性:可以在多种设备上运行,包括移动设备和桌面计算机。

开源地址:https://github.com/TMElyralab/MusePose


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多