百度PaddleOCR累计下载量突破900万，被超5.9k开源项目使用

2025-09-19

产业家网 9月19日消息，近日，百度在海外官方账号介绍了最新轻量级文字识别模型 PP-OCRv5。该模型仅0.07B参数，以千分之一参数量实现与700亿参数大模型相媲美的OCR精度。在多项 OCR 场景测试中，PP-OCRv5的表现超越GPT-4o、Qwen2.5-VL-72B等通用视觉大模型。最新信息显示，飞桨团队发布的技术Blog已连续一周登顶Hugging Face博客热度榜首，受到开发者社区的广泛关注。

9月18日晚，Paddle OCR项目登上了GitHub全球总榜 trending榜，位于python榜第5，总榜第13。

据了解，2025年5月，飞桨团队推出PaddleOCR 3.0版本，文字识别方案PP-OCRv5与通用文档解析方案PP-StructureV3，以及原生支持文心大模型4.5的智能文档理解方案PP-ChatOCRv4共同构成其三大特色能力。自2020年开源以来，PaddleOCR累计下载量突破900万，被超过5.9k开源项目直接或间接使用，是GitHub 社区中唯一一个 Star数超过50k的中国OCR项目。

写评论...

首页

找工作

客户服务