







我最近用AI帮我啃长文档,分析行业研报公司财报,感觉其实一直有个巨大的痛点没被解决🤔
以往我们用AI读这些PDF,强如Gemini 3 pro(确实它分析得贼牛),它也只能给你总结一堆干巴巴的文字。文档里那些关键的趋势图/数据表/对比曲线,往往在转换过程中就丢失了,或者变成了一堆容易产生幻觉的描述
我觉得这就是之前视觉模型的通病
但今天智谱开源的GLM-4.6V (106B-A12B),让我看到了解决这个问题的新答案
它的做法是自动调用工具,把文档里对应的关键图表截取出来甚至重新制图,然后像公众号编辑一样图文混排多模态地输出给你。
还有后面的识图购物以及前端复刻,确实一并满足了我对新交互方式的想象
体验细节包括prompt都放在图里了⬅️,朋友们可以去自己试试看
#AIChannel #ai #AI工具 #大模型 #多模态 #多模态融合 #智谱AI #GLM #智谱 #AI
以往我们用AI读这些PDF,强如Gemini 3 pro(确实它分析得贼牛),它也只能给你总结一堆干巴巴的文字。文档里那些关键的趋势图/数据表/对比曲线,往往在转换过程中就丢失了,或者变成了一堆容易产生幻觉的描述
我觉得这就是之前视觉模型的通病
但今天智谱开源的GLM-4.6V (106B-A12B),让我看到了解决这个问题的新答案
它的做法是自动调用工具,把文档里对应的关键图表截取出来甚至重新制图,然后像公众号编辑一样图文混排多模态地输出给你。
还有后面的识图购物以及前端复刻,确实一并满足了我对新交互方式的想象
体验细节包括prompt都放在图里了⬅️,朋友们可以去自己试试看
#AIChannel #ai #AI工具 #大模型 #多模态 #多模态融合 #智谱AI #GLM #智谱 #AI

研报速递
发表评论
发表评论: