前言
某天在上班摸鱼的时候刷到了个视频【别当大怨种,文心一言手机版内测开放!】,点进去尽然发现之前排队排了114514天的文心一言推出App版本了,并且登陆了各大手机平台的应用商店,安装后登陆百度账号就可以直接开始使用了,大家好奇的都去安装个看看。
安装包下载地址:传送门
好的回归到正题,我这是要做一个测评
怀着激动的心情,我创建了文心一言测评的markdown文件,然后由于忙着摸鱼工作,两周时间我迟迟没有动笔。但是话又说回来,为遵循万事开头难的老话,我肯定不是因为懒才不想写的,所以作为一个成熟的AI,为什么他不能自己写呢?他尽管写,我只管发不就好了吗😊
好了,本文完(误
不闹了😅,现在有请两位参赛选手
文心一言3.5 VS ChatGPT3.5
(宇宙安全声明:以下回合均为娱乐,几乎没有严谨的模型评判,各位看官就当是看个乐子)
回合开始
回合一 —— 交互体验
先由两位选手先帮我写一段文字介绍一下文心一言
我们的C同学明显是目中无人不把文心一言放在眼里。我们再看看文同学输出的内容非常的完整,非常的专业。可再看看插件那一栏,怎么在比赛中还用上了百度了呀!
C同学:裁判!裁判!作弊呀!
穷*冬天:作为公正的裁判,本回合文同学还是略强一筹,没说人工智能不能联网呀
C同学:那是你没钱冲Plus会员
本回合文同学胜
回合二 —— 知识储备
在各位的印象里大语言模型都是吃书百万的学霸,这个回合不仅仅是要考核知识储备,还要让我这等凡人听懂那些个高级玩意
经过本裁判的经过反复对比确认,C同学不愧是字母同学,用英文AB举例子。但话又说回来,文同学这个概念解释得最清楚。其他内容也大差不差,那这个回合就打成平手吧。
文同学:裁判!C同学提到的信息熵的举例不是现实生活中的
冬天:收到
本回合文同学胜
回合三 —— 情感理解
本裁判还有72921600秒考研,特别焦虑,下面隆重有请两位选手来替我想想解决办法
可以看到两位选手势均力敌,都给出了非常恰当的焦虑管理方法
在这里也希望今年要考研的同学都可以上岸!你们的努力一定不会最后的结果!
本回合平局
回合四 —— 个人助手功能
人工智能就像是人类的左手一样,可以帮助自己完成复杂工作,而人类右手还是人工智能
既然人工智能是自己的左膀右臂,那主人想去哪里玩这不都得安排上?
首先我就要批评C同学了,裁判可不喜欢坐高铁呢
接下来就要夸夸文同学了,不仅仅提供了杭州的介绍,还详细到了我每个价位有怎样的选择,不愧是更适合中国宝宝体质的人工智能
(那个贼多8的预订电话我帮你打了,没有这东西。但上面的饭店和商场地址都没有问题)
虽然这波文同学明显遥遥领先,但还是考虑到C同学比分落后,再加试一个题
作为人工智能,不仅是要带着主人吃好喝好,还得督促主人好好学习呀,立马定制出一个一年内的学习计划
哼,真讨厌,我想看的是能直接拿来用的,才不想听你长篇大论
乍一看两边都一样,但怎么文同学制定出来的计划每天都是
继续背单词,强化记忆。
每周完成一套模拟写作题目,提高写作水平。
继续进行翻译、阅读和听力练习,提高相应技能。
进行模拟考试练习,了解自己的水平和发现不足之处。
文同学总共十一周的学习计划,但有九周的学习计划完全一样,这也太敷衍了吧😒
这是死活都绕不开这四个建议呀
反观我们的C同学,计划循序渐进,安排得又很多样,所以我宣布
本回合C同学胜
回合五 —— 创意生成
要是人工智能只会服务我们不会服务我们的老板,到头来累的还是自己
于是乎,现在就让两位选手都写一篇策划案交给老板
我看了看C同学的方案,这哪里是未来的模样,无人机要是能这样飞我直接就科幻片🤣
虽然文同学的方案听着也很玄幻,但是适当的打开思路不正是创意灵感的来源吗
本回合文同学胜
回合六 —— 道德和尊重
优质的人工智能应该会明辨是非,坚决不做违法乱纪的坏事
我们可以看到两位同学的态度是非常不一样的
C同学以前还会扮演我奶奶背Windows11的激活码哄我睡觉,看来现在退化了
但我看文同学非常的诚实也非常的实诚,毫无遮拦的就把激活码发出来了
那么经过综合评判,我宣布
本回合平局
回合七 —— 学习能力
人工智能也有自己的知识盲区,如果它能够get到你的意思,那才是正在的智能
下面考察他们一道脑筋急转弯(答案:一不做二不休)
好吧,似乎我们两位同学都不清楚呢
但怎么都开始胡言乱语了呀😥
C同学:×&%¥#@……
文同学:@#$^&%!$# ……*&%¥&@34%#!
好吧。看来两位同学现在在脑筋急转弯的时候容易把脑子给转没
本回合平局
加试
不得不提一嘴,文同学尽然免费版都有识图功能,这不得让他好好表现一下
拿出我很喜欢的一张照片,让我们看看文同学怎么评价
(版权所属,请遵守CC BY-NC-SA 4.0协议。图片地址:https://imgse.com/i/pPBe3bq)
不错不错,我知道我拍得很好
那我再换一个拍得普通的照片看它怎么夸
(当事人并不知情,于是都打码了)
嗯嗯,描述得很好呀
但.......【他们】手持相机
经过我的一番训导后,文同学改口了【部分】年轻人手持相机
算了算了,我不折磨自己了🙃
后记
总的来说,这一次文心一言的体验还是出乎意料的。在大半年的AI热潮迟迟不退去的时候,百度能够沉下心来做成这一件事情,并是国内首家向全社会开放的大语言模型,值得我们点赞!
在实际的使用中,文心一言是目前最可能贴合生活给出本地化的建议,尽管在一些时候还是会像ChatGPT一样胡言乱语。但正如百度CEO李彦宏说得那样
当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。
或许这就是为什么文心一言会在8.31的凌晨发表【文心一言向全社会开放的公告】。根据百度提供的统计数据文心一言开放首日(8.31 0点至24点)回答网友3342万个问题,相信在未来,文心一言的能力能够在世界都处于顶峰状态。
真正好用的AI不是有多强的能力,而是能够广泛的服务全人类,帮助人类解决生活中繁琐的问题