CSIG携手金山办公举办“企业行”专场 探讨AI时代文档识别前沿技术
(资料图片仅供参考)
5月7日,由中国图像图形学学会(CSIG)主办、金山办公承办的“CSIG企业行”系列活动在珠海金山软件园成功举行。活动以“AI大模型时代文档识别和理解前沿技术探讨”为主题,特邀来自中科院、北京科技大学、华中科技大学、华南理工大学等院校的专家学者,与金山办公技术团队共同探讨文档识别领域的前沿技术研究及实践成果。
中国科学院自动化研究所副所长刘成林表示,大模型时代的开启为文档识别带来了新的机遇和挑战。从早期的单字识别到字符串整体识别,再到手写文档版面分析和自然场景、视频文本中的文本检测,文档识别目前已历经三个研究阶段。而近年来人工智能深度学习等技术的成熟,使大模型成为文档识别与理解的全新研究方向。
华中科技大学白翔教授针对视觉与语言模型的研究做了详细介绍,他认为这几年多模态和跨模态对各个领域都带来非常深远的影响,各行各业围绕大模型去做定制化方案,包括对大模型本身进行调整,都有重要意义。
华南理工大学金连文教授分享了面向文档图像的篡改文本检测的最新研究成果,金连文教授表示,SSL OCR 技术(使用SSL加密协议的OCR技术)、大模型与OCR结合、视觉大模型等是值得关注的技术方向。AI大模型技术无论是在垂直领域还是通用领域,均具备很大发展空间。
除前沿理论研究分享外,金山办公CV技术总监熊龙飞以扫描件PDF编辑为案例,分享了AI大模型时代文档识别技术的最新实践成果:扫描件PDF编辑新模态。扫描件PDF因变成了图片,其排版、内容、字体、段落等信息丢失,还可能存在污染、变形、对象层叠等问题,解决这些挑战对算法和服务架构有非常高的技术要求,金山办公经过多年研发已经将该领域做到了令人耳目一新的效果。据了解,该功能已于2023年3月逐步上线,在未来还将持续迭代。
针对大模型技术的实际应用,姚冬表示,大模型技术不仅可极大提高办公软件的工作效率,同时此类软件庞大的基础用户量,又为不断改进大模型提供了数据支撑。“金山办公在这个领域扮演的角色就是落地应用,金山办公具备大量的功能API接口,通过结合大模型可以调动这些能力,实现很多对用户很便利的功能。这些API能力背后是金山办公35年来在文档处理和排版领域的技术积累。”
据悉,金山办公基于大语言模型的人工智能应用“WPS AI”,第一站搭载在金山办公在线内容协作编辑产品轻文档上,未来WPS AI还将以用户体验为优先级,逐步嵌入金山办公全线产品。
关键词:
相关新闻
- CSIG携手金山办公举办“企业行”专场 探讨AI时代文档识别前沿技术
- 永鼎股份(600105)盘中异动 股价振幅达10.62% 跌7.13% 报5.85元(05-09)_世界实时
- 视焦点讯!中国银行间市场交易商协会对江西银行予以通报批评
- 涨停!涨停!3.5万亿板块突然爆了!却有个股崩60%_焦点
- 2023年宁波外籍学生怎么进行小学报名?
- 西藏珠峰董秘回复: 公司在所控股阿根廷盐湖提锂项目上采用的“吸附+膜”工艺技术具有一定的国际领先水平_热资讯
- 长沙都悦教育科技有限公司虚假骗钱
- 银行股开盘继续走强 中国银行涨超5%创历史新高|世界观点
- 焦点消息!视频博主、线上讲师、带货主播 数字分身正批量“上岗”
- 当前热门:果麦文化5月9日快速反弹
- 禾信仪器:5月8日融资买入96.56万元,融资融券余额4022.79万元-独家焦点
- “帮手”变“凶手” 防蚊时勿忘防火
- 橹怎么读 橹的读音是什么_观热点
- mp3高音质下载_高品质mp3下载无损MP3 世界观察
- 焦点!长沙再制造工程机械赶海记
- 我市进一步优化政策 促进房地产市场平稳健康发展 世界热议
- 智通全球财经日志|5月9日
- 侨源股份(301286):5月8日北向资金增持8.48万股
- 张吉怀高速铁路联调联试_张吉怀高速铁路
- 宝安区民政局婚姻登记处(宝安区民政局)
- 观焦点:闯出精彩·自贸港的年轻人丨“95后”青年张运年:捐赠超百万元课程 助力海南乡村教育
- 当前通讯!西安25地拆迁、回迁、安置最新消息来了!快看有你关心的吗?
- 世界热门:欧拉4月销量同比增长188.24%,长城炮蝉联皮卡销冠
- 网信部门工作组进驻斗鱼平台_全球报道