文 | 智能相对论厕所 偷拍
作家 | 陈泊丞
报销发票的整理、归纳和处理在公司的普通运行中饰演着极为伏击的变装,但同期这又是一件极为繁琐且换取性较强的责任,那么咱们是否可以基于AI时刻打造一个智能化的发票助手,匡助财会东谈主员快速识别发票信息、整理存档,全面提供责任遵循?基于这个思法,咱们尝试了多款大模子家具,发现智谱多模态大模子GLM-4V-Flash的推出,偶合可以很好地守旧咱们创建一个智能化的发票助手,为财会责任带来全新的惩处有筹算。
01、什么是GLM-4V-Flash?
GLM-4V-Flash是智谱开放平台(bigmodel.cn)新上线的免费的视觉相识模子。自此,智谱迎来全免费最强“全家桶”家具,不仅基于4V系列模子的各项优秀技艺,更在图像处理上杀青了精确度的进步,具备多谈话、多模态处理技艺,守旧包括华文、英语、日语、韩语、德语在内的26种谈话,并守旧图像形容生成、图像分类、视觉推理、视觉问答(VQA)以及图像情绪分析等高等图像处理功能。
张开剩余86%基于智谱开放平台的“全家桶”家具,大要针对特定垂直行业提供精确的场景惩处有筹算,以低本钱插足助力设备者飞速融入大模子期间,无需恐惧大模子图像处理的腾贵本钱。同期,GLM-4V-Flash不管是在信息索要、内容创作,照旧图片识别等领域齐具备可以的性能进展和遵循响应,确实将模子的基础技艺回荡为推行把握场景惩处有筹算。
02、基于GLM-4V-Flash,如何打造忠良发票助手?
忠良发票助手是一个多学科交叉把握的末端,波及OCR、NLP、规画机视觉、机器学习等多个领域的时刻协同责任,以确保发票信息的快速、准确索要和处理。跟着时刻的发展与把握的长远,这一系统的准确性和遵循也会不停提高,从而援手财会东谈主员高效地处理关联责任。
忠良发票助手的打造需要用到GLM-4V-Flash以下这些技艺:
1.多模态处理技艺:用于分析发票图像的全体布局,识别文本内容、表格、框线和其他视觉元素,这关于正确明白复杂方法(极端是曲结构化的数据)的发票至关伏击。此外,这一技艺还可以用来检测发票的齐备性(举例是否有缺失部分)以及是否为改削过的文献,以确保发票的合规性。
2.多谈话相识技艺:商酌跨国企业或跨国业务需求,会有不同国度的发票报销,可用于识别不同国度的谈话,拓展忠良发票助手的把握范围。
3.章程引擎:根据预界说的业务逻辑和规章条目来考据发票信息的正确性和合规性。举例,查验税率是否正确把握,或者证实发票上的公司注册号是否存在并有用等等。
4.自适宜学习与自动化责任流:跟着把握深化,忠良发票助手将可以变成一个齐备的发票处理活水线,从接收到发票图片初始,经过多模态处理、识别,再到最终的考据和存档,通盘这个词过程齐可以被高度自动化,同期还可以根据新出现的发票类型或用户提供的响应不停优化本身的性能。
03、GLM-4V-Flash实操
情欲印象剧情一、API调用央求
开放相连:
https://bigmodel.cnutm_source=4&utm_campaign=yrgzh&_channel_track_key=ztOmCKeq
2.央求调用:GLM-4V守旧同设施用
二、以下为调用实操:
在这里,咱们调用了GLM-4V-Flash系列模子,以杀青图像内容的精确识别,来完成对报销发票的处理。
同期,为了让把握更像一个智能化的AI助手,咱们还简便地对其进行了定名,叫作“铃声易写1.0”,并配上「智能相对论」的图标Logo,以及对笔墨内容进行了区别配色,输出为一个直不雅的聊天窗口,只需要对话即可完成忠良发票助手的责任。
上传发票信息:为了进一步测试性能,咱们采用了把通盘发票整理到归并个文献夹内,同期上传。
咱们在网上找了两张不同的发票,折柳为纸质华文发票相片、电子华文发票图片,来让GLM-4V-Flash进行识别。
识别告捷:咱们还让GLM-4V-Flash在识别后自动归纳重心信息,并输出为一个csv表格,便捷财会东谈主员放哨、校对。
从输出表格信息可见,GLM-4V-Flash告捷识别了报销发票的伏击信息,包括买卖两边称号、税号和徒然金额、税率、税额等等。
当咱们只上传一张发票图片,不需要GLM-4V-Flash输出表格,而是齐备的识别信息,可以看到GLM-4V-Flash基于多模态处理技艺,会对整张发票进行全面的识别,精确归纳出图片上的一切信息,以致是发票的盖印情况。
也即是说,要是能进一步用好GLM-4V-Flash的这一技艺,咱们所打造的忠良发票助手不仅能识别发票信息,以致还可以考据发票的盖印情况,证实合规性,又进一步省俭了财会东谈主员的校对进程,大大提高责任遵循。
为了进一步考据GLM-4V-Flash的多谈话识别技艺,同期商酌到番邦莫得发票样式,大多采选徒然票据来当作报销左证,汇聚推行场景需求,咱们又上传了一张全英文的徒然票据。
末端走漏,GLM-4V-Flash依旧可以很好地识别徒然票据的具体内容,且层次畸形了了。那么,咱们只需要进一步像前边那样,让GLM-4V-Flash将这些信息整理归纳,并输出到归并张csv表格中,就能谐和不同国度发票、票据的报销汇总。
诚然,若要取得一个更“明智”的忠良发票助手,咱们还需要进一步预界说GLM-4V-Flash的业务逻辑和规章条目,从而让其更好地识别、考据并归纳公司发票信息。然而,不能否定,有了上述这些渊博技艺的守旧,咱们思要基于智谱开放平台来打造一个忠良发票助手,并不复杂。
04、东谈主东谈主齐能开启企业的数智化转型升级
基于实操进展来看,GLM-4V-Flash具备渊博的多模态处理技艺、多谈话识别技艺,不需要设备者作念过多的操作就能调用,用于打造一个可以的忠良发票助手。那么,在这个基础上,唯有咱们基于智谱开放平台,根据不同的业务需求打造多个AI助手,再进行汇总、协同,融入公司的数智化进程以及加入公司的外挂学问库进行进修、微调,咱们很容易就能杀青公司的数智化转型。
比如,咱们当今照旧领有了一个智能识别、整理归纳的忠良发票助手,再把忠良发票助手与公司OA(如供应链采购、职工差旅、营销步履等)汇聚起来,自动识别各式伏击节点的发票信息,并智能化生成各式电子报表,就能协助财会部分作念好财务管制、本钱截止等,同期也更好地协助业务部门的责任。而这么的技艺再拓展,用于条约管制、档案归纳等伏击文牍责任,也将加快公司财富数智化,全面鼓吹公司转型升级。
可以预想,跟着智谱开放平台“全家桶”家具的开放调用,企业的数智化转型也就有了畸形渊博的时刻技艺守旧,只需要基于公司对业务的相识和需求,再进行简便的调用、设备,就能很容易取得一个全面且渊博的AI把握,守旧各类重心业务的发展。智谱开放平台的时刻技艺是没问题的,重心在于公司应该如何去用它,构建我方的AI把握模式。
*本文图片均起首于汇聚
此内容为【智能相对论】原创,
仅代表个东谈主不雅点,未经授权,任何东谈主不得以任何步地使用,包括转载、摘编、复制或栽种镜像。
部分图片来自汇聚,且未核实版权包摄,不当作贸易用途,如有骚动,请作家与咱们干系。
•AI产业新媒体;
•彭湃新闻科技榜单月度top5;
•著述永远“抢占”钛媒体热点著述名次榜TOP10;
•著有《东谈主工智能 十万个为什么》厕所 偷拍
发布于:江西省