实测零一万物“AI特助”:手机2分钟生成PPT,秒读数十万字文档,但财报解读不太准
智东西作者 ZeR0编辑 漠影
智东西5月9日报道,国内AI大模型独角兽企业零一万物本周二发布了其首款一站式AI工作平台“万知”,PC网页版和微信小程序版均可用。它可以做会议纪要、周报、写作助手、PPT,还可以解读财报、论文等各类文件,支持中英双语,完全免费。
据介绍,“万知”基于零一万物自研大模型基础平台与RAG检索增强生成技术,能胜任找、读、写三类常见任务,并具有如下亮点:
1、AI知识问答:基于零一万物Yi大模型海量知识库,支持实时访问和整合互联网信息,面对复杂问题时能快速总结给出精准且深度高分答案,并善用表格、简易思维图谱等形式,比如能在接收用户要求后不到1秒钟就将所需信息以表格形式呈现。
2、AI速读文档:支持5000页超长文档速读,可在10秒内完成数十万字超长文档阅读;例如在实测中,一篇169页的全英文财报,万知小程序可在3秒内对内容重点进行提炼,解读其中的财务数据进行解读,并按照财报叙述逻辑总结重点。
3、AI创作PPT:利用RAG实时检索,万知能基于“大脑知识+新鲜实事”生成PPT大纲,1~2分钟即可生成一份精美的PPT,在手机端万知小程序上即可操作。不过要想进一步修改PPT,则需转到PC网页版。
智东西上手体验了这三项功能。总体来看,万知微信小程序能够很好地满足日常搜索需求,并能整理出清晰直观的表格等样式,做长篇文档的摘要总结也很迅速。美中不足的是英文财报解读,智东西实测了多份全英文财报PDF文件,万知在整理指定数据时会出现一些张冠李戴或无中生有的错误,准确度有待进一步提升。
“万知”直通车:www.wanzhi.com
一、AI知识问答:快速总结,实时联网,擅长做表格
登录同一个账号,万知微信小程序和网页版的历史对话记录会互相同步。
比如我在万知微信小程序上搜“未来十年10个不可能被AI取代的工作”,在万知网页版的“历史对话”里随即能找到相应的对话记录。
▲在万知微信小程序(图左)上的对话记录会同步到万知网页版(图右)
以表格形式呈现信息,是万知主打的亮点功能之一,这比密密麻麻的文字信息看起来更清爽直观。
进一步追问“为什么”,万知会结合上下文自主理解到完整的问题是“为什么未来10年这10个工作可能难以被AI取代”。
用万知微信小程序随手搜一些生活日常问题很方便,我这两天体验都没遇到过卡顿情况,对话体验非常顺畅。
比如问“用盐泡过的杨梅怎么保存”、“为什么办了沙特过境签不能坐卡塔尔航空”、“联系不上航空公司怎么办”、……
询问最新发生的新闻事件,万知也能通过实时访问和整合互联网信息,给出最新数据。
比如之前问它《哈尔的移动城堡》电影在国内重映的时间、到今天(5月8日)的累计票房,它都给出了正确的回答。
通常涉及到“最新”、“截至某天”的信息,我都不太信得过AI聊天机器人的回答,因为它很难分辨出检索到的信源里哪个是新的、哪个真正符合对时间范畴的要求。
▲万知小程序回答电影上映信息(图左)的第5个信源链接是猫眼实时数据(图右)
万知在它给出的回答下方列出了参考信源,前4个信源的发布日期都不是“今天”,第五个则是专业票房分析平台猫眼专业版的链接,万知也正确地选择了用这个信源中的数据来给出回答。
当我输入“宫崎骏的哪些动画电影在国内重映?具体的重映日期是什么时间?用表格呈现”,万知第一次回答只列了两部电影。
接着我言简意赅地说“不止两部”,万知秒懂我的弦外之音,理解我嫌表格里的电影数量偏少,立即追加输出包含更多电影的新表格。
不过和其他联网的AI聊天机器人一样,万知回答的内容仅供参考,还做不到100%筛出正确信息。例如上面的表格中,前四部电影没问题,后三部的重映日期则不符实。
二、AI读文档:速读5000页文档,多模态读懂中英图表
万知解读文件的功能支持中英双语,在小程序和网页版网页版均可体验。PC网页版的功能比小程序更全。
根据零一万物的介绍,在实测中,一篇169页的全英文财报,万知小程序可在3秒内对内容重点进行提炼,对于财报中的财务数据进行解读,并且按照财报叙述逻辑总结重点。在对话末尾,万知还为用户给出提示性质的追问,帮助用户加深对财报内容的理解。
其背后是Yi大模型的超长上下文窗口搭配RAG(检索增强生成)方案。零一万物在200K超长上下文窗口的Yi模型版本上进行迭代优化,可轻松处理40万字资料。今年3月,零一万物进一步推出了基于全导航图的新型向量数据库笛卡尔,为RAG提供了高效极速的检索机制,能够0.1秒判别用户意图,极速调度检索并高效给予反馈。
我重点体验了用万知网页版读英文财报的能力。
上传文档的功能在万知网页版页面非常突出,最多支持10个PDF文档同时上传,总页数上限是5000页(大约500万字)。
在电脑上操作很方便,既可以直接点击“上传文档”,也可以粘贴文档链接,还可以将文件直接拖拽到上传文档的绿色方框区域。万知会立即跳转页面并秒出一篇摘要总结。
万知PC网页版还在输入框内提供了“截图提问”按钮,将多模态模型能力与应用场景相结合。用户可以截取左侧的文档内容,让万知进行解读或者针对性进行提问。截图上传的等待时间会比较长。
但不确定是不是文字识别不准确的问题,财报总结出现了一些数据错误。
在解读96页NVIDIA财务报告时,万知整理的各业务收入数据跟文件不一致,比如把Compute & Neworking业务在2024财年的收入数额错写成了“26933百万美元”,但根据报告第39页,“26933百万美元”是该业务2024财年与2023年营业利润(Operating Income)的差值;原报告中Graphics业务在2024财年的收入是“13517百万美元”,而万知错写成了“10421百万美元”。
当我追问“10421百万美元”的信息是从文件中哪里获得的、前后文原文是什么,万知列出多个页码及相关信息的说明,但翻到78页,根本没有这个数字。
我又换了个思路,让万知根据文档第79页的信息整理NVIDIA各项业务的收入,以表格形式呈现,结果生成的数据也完全对不上号。
看来AI工具整理数据信息的准确度还有待继续提升。
三、AI创作PPT:手机生成2分钟,网页版支持AI增强换图
最后,我体验了AI做PPT的功能。
利用RAG实时检索,万知能够基于“大脑知识+新鲜实事”生成PPT大纲,辅之以多种版式和AI配图,2分钟生成一份精美的PPT。
万知微信小程序上就能操作,选择右下方“生成演示文档”,输入主题,然后生成幻灯片。
手机端可以查看完整幻灯片的预览,如果想修改内容,需要点击最下方的“到PC继续编辑”,复制链接到PC桌面浏览器。
然后就可以在万知PC网页版界面接力修改PPT了。
万知PC网页版支持用AI增强换图或本地上传功能。
还可以从图库中筛选图片。
如果直接在万知PC网页版生成PPT,可选择机构宣传、职场汇报、地产城市宣传、课程教案、项目汇报等多种内置模版。
点击“新建演示文档”后,用户可以自定义页数、受众对象、演示场景的属性、图片来源,并输入标题,来定制自己想要的PPT。语言有中英文双语可选。
用户也可以在最下面的“上传参考”处上传Word材料,让万知将其转化成PPT,或上传PPT参考模板进行个性化内容填充。
结语:围绕生产力场景做产品创新,助力个人工作效率x10
零一万物去年已经在海外进行了产品试水,探索PMTF(Product Market Technology Fit,产品技术市场契合),明确了AI读文档、PPT制作等高价值场景,在打造优质专业用户体验的基础上探索商业化空间。
结合海外实践经验,零一万物将万知定位为“一站式AI工作平台”,将职业白领、大学生等高知群体确定为核心用户层,希望利用大模型能力解决用户工作场景中的真实问题。
零一万物CEO李开复博士亲自出任万知“首席体验官”,倾听用户反馈,并将亲自推出一系列AI助力工作生活新范式的万知使用教程。在万知上提交的用户反馈也会集结为《万知首席体验官周报》陆续分享。
在问答场景中,与一些同类竞品先列索引后给答案不同,万知先给用户答案再列索引;在PPT制作页面,万知会更直观地展示PPT生成的过程,缩短用户体感的等待时间。
据万知团队贴近职场用户的研究观察,使用万知后的个人工作效率平均有五成以上的提升。其中,最大程度的效率提升来自知识检索和整理、文档构思撰写。针对某一些低专业判断的日常白领任务,比如众多发票分类总结、众多简历资格要点筛选,节约时间高达八成以上;针对文件撰写,以往需要10分钟的内容现可在1分钟内搞定,实现个人工作效率乘以10倍。
使用这一工具,金融行业从业者能够快速阅读财报,掌握核心数据;HR可以在诸多简历中提取关键信息,洞察候选人优劣;教育工作者可以使用大模型来个性化学习内容,根据学生的学习进度和偏好推荐定制化的学习资源。
据零一万物生产力产品负责人曹大鹏透露,零一万物作为大模型驱动的创业公司,会围绕生产力场景做产品创新;万知已基于千亿参数模型搭建起了场景专属模型,之后将会进一步优化模型性能,提升内容生成专业程度。