当前位置: 主页 > 新机快讯 >

欧洲“DeepSeek”宣布了全世界最好的 OCR,网友:蹲蹲中国的收费

发布者:admin
来源:未知 日期:2025-03-15 09:34 浏览()
就在刚,谁人已经开源了首个 MoE 模子的欧洲始创公司 Mistral AI 在沉静一段时光之后又出新活。Mistral 团队宣布了一个号称“全天下最好的 OCR”的产物 —— Mistral OCR,旨在将一些 AI 难以直接辨认的毛糙且庞杂的文件停止收拾,便于 AI 操纵辨认。帖子一经收回,批评区霎时充斥了种种夸夸舆论,但在一众夸奖声中,也不乏一些真正用过产物的网友的明智谈话。就比方有网友对 Mistral OCR 的产物才能表现认同,但却有点接收不了它的产物订价,感到有点太贵,而且等待中国 AI 公司早点宣布一个相似的开源版本,把价钱打上去。同时也有网友亲身上手,上传扫描了手写板的内容,但最后辨认出的笔墨成果准确率并不是很高。除此之外,另有被 Mistral 所宣扬的“能够辨认超多种言语”噱头吸引过去的网友,但应用后却扫兴的发明它无奈辨认本人所用言语。只管 Mistral OCR 现在还存在着必定的范围性,但它的呈现确切是一次从字符辨认加入景智能的逾越。从图文到构造化数据的一年夜步与传统的 OCR API 差别,Mistral OCR 是一款多模态 API,它不只能够辨认文本中能否嵌入了插图或照片,还会为这些图形元素创立界限框,并将它们包括在输出中。从 Mistral AI 团队放出的 Demo 视频能够看出,Mistral OCR 可能将图文混排的 PDF 文件转换成构造清楚的 Markdown 格局文件。比方表格+数字的 PDF 组合。PDF 图片中数学公式的转换。PDF 宣扬图片中的印地语。拍得并不朴直的论文照片。乃至带有水印的笔墨也能够轻松辨认。从字符辨认加入景智能的一年夜步除了直不雅的 Demo 外,Mistral AI 团队还罗列了 6 点 Mistral OCR 的相对上风:出色的庞杂文档剖析才能:Mistral OCR 在懂得庞杂文档构造方面表示杰出,可能精准剖析交织的图像、数学公式、表格以及 LaTeX 等高等排版格局。这使其在处置包括图表、图形、公式跟插图的迷信论文等富文本文档时更具上风。原生支撑多言语与多模态:Mistral OCR 自带多言语跟多模态处置才能,可能机动应答差别言语以及多品种型的内容,无需额定适配。行业当先的基准测试表示:在多项行业基准测试中,Mistral OCR 均获得优良成就,充足展现了其微弱的机能跟高正确度。同类产物中处置速率最快:Mistral OCR 采取轻量化架构,处置速率远超同类产物,单节点每分钟可剖析高达 2000 页文档。无论在高负载情况仍是年夜范围数据处置中,它都能坚持高效运转,确保稳固机能。翻新性的“文档即提醒”构造化输出:Mistral OCR 率先引入“文档即提醒”观点,应用户可能直接应用文档作为指令,以获取愈加精准跟定制化的成果。它还能输出 JSON 等构造化格局,便于与后续义务或主动化流程连接,实现更智能的内容提取。可选的自托管安排计划:针对数据隐衷请求严厉的企业或机构,Mistral OCR 供给自托管安排选项,确保敏感信息一直存储在当地基本设备内,满意合规性与保险性需要。团队还将 Mistral OCR 将 Google Document AI、Azure OCR、Gemini 系列模子以及 GPT-4o 的产物机能停止对照。开元官方网站入口终极的成果标明,Mistral OCR 在总体正确率、数学公式辨认等方面表示优良,特殊是在 2503 版本中,各项指标均年夜幅晋升,到达了新的高度。
分享到