文本检测和文本识别可以分成两个部分; 目前的深度学习方案也有很多端到端的系统。

本质也是计算机视觉中的一种物体检测和识别分支;

-- 传统方法用手工特征提取检测是否文本区域;

    之后通过传统的机器学习方法,例如 支持向量机 SVM等方法 将特征分类,识别字符。

-- 深度学习方法,用卷积神经网络提取特征,之后检测; 或分类。

截至2021年11月,目前的一篇综述论文详述了各个类别的方法。

参考论文:

Long S, He X, Yao C. Scene text detection and recognition: The deep learning era[J]. International Journal of Computer Vision, 2021, 129(1): 161-184.

下载链接:SceneTextDetectionandRecognition_TheDeepLearningEra.pdf-互联网文档类资源-CSDN下载

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐