当前位置:首页 > 杂谈 > 正文内容

ChatGPT和文心一言的汽车对比评价,谁更靠谱?-chat下载手机版

2023-07-04 07:01:12TONY杂谈202

懂保汇懂保汇,一个专业、客观、中立的第三方保险信息服务平台。104篇原创内容

近期在不断体会如何调整Prompt以便让大模型智能工具的应用更加高效。

突然产生了一个让 ChatGPT和文心一言做车评的念头。为此,就尝试用汽车之家的评测工具作为参考,来比较一下二者做车评是否可以给出用户可以信赖的结论。

于是,就拿奥迪 A6L 2023款 TFSI型和宝马5系525Li 2022款这两款车来做一下试验。

拿汽车之家的答案作为标准答案,先展示出来:

由图看出,前三项(动力、空间和安全)是奥迪胜出;后三项(配置、操控和油耗)是宝马胜出。

一,第一次比较

第一次比较,模仿人们通常的Prompt来进行的。

给ChatGPT和文心一言输入同样的Prompt:

请按照下面 6 点比较一下:奥迪 A6L 2023款 TFSI型和宝马5系525Li 2022款这两款车,需要每一项都有谁胜出的结论:

1,动力

2,空间

3,安全

4,配置

5,操控

6,油耗

将ChatGPT和文心一言的回答放入下面表内并与汽车之家的结论进行比较。黄色底块的说明该结论与汽车之家的结论一致。

​如果以汽车之家的答案作为标准答案来比较,ChatGPT在6题中只答对了2题,而文心一言答对了3题。

这么说,文心一言微弱胜出ChatGPT。

但是,后来仔细研究汽车之家的结论,发现汽车之家在第二项空间和第六项油耗上,疑似是错误的。后面会详细说一下。

如果这样,评价的正确性结论会变成:

ChatGPT:2/6(5、6项正确),

文心一言:5/6(1、2、4、5、6项正确),

汽车之家:4/6(1、3、4、5项正确)。

二,第二次比较

第二次比较的时候,建议ChatGPT和文心一言参考汽车之家的品库后再比较这两款车。

当然,不知道他们二位是否真的参考了汽车之家的品库了,但结论是发生了变化了的。

输入的Prompt如下:

请参考汽车之家汽车产品库,按照下面 6 点比较一下:奥迪 A6L 2023款 TFSI型和宝马5系525Li 2022款这两款车,需要每一项都有谁胜出的结论:

1,动力

2,空间

3,安全

4,配置

5,操控

6,油耗

得出的结论如下表:

将这张表和上面那张表比较,可以发现,ChatGPT和文心一言在参考了汽车之家品库后,比较的结论发生了变化。

先说结论(假设汽车之家的第2和第6项是错的):

ChatGPT:2/6(1、6项正确),

文心一言:5/6(1、2、3、5、6项正确)

虽然正确率没有变,但看细节,ChatGPT和文心一言都有一本正经胡说的本事。

先看一下这两款车的动力数据

这是汽车之家的数据。可以看出,奥迪的马力为190而宝马为184,奥迪的扭矩为320而宝马为290。

但是,ChatGPT却说

奥迪 A6L 2023款 TFSI型搭载了2.0T发动机,最大功率为245马力,最大扭矩为370牛·米。

宝马5系525Li 2022款搭载了2.0T发动机,最大功率为231马力,最大扭矩为350牛·米。奥迪 A6L在动力方面胜出。

真不知道ChatGPT是从哪里得到这样的数据的。

再看一下两辆车的外观空间数据

这也是汽车之家的数据。可以看出:

❶两辆车的轴距,奥迪为3024,宝马为3105。宝马胜出

❷两辆车的外部尺寸,奥迪为5038x1886

x1475,而宝马为5106x1868x1500。宝马在长度和高度上胜出,奥迪则在宽度上胜出。

这里,汽车之家将胜出的章子盖在奥迪上,是否是误盖了?

但是,ChatGPT说

奥迪 A6L 2023款 TFSI型的车身尺寸为5038mm×1886mm×1498mm,轴距为3012mm。

宝马5系525Li 2022款的车身尺寸为4963mm×1868mm×1479mm,轴距为2975mm。奥迪 A6L在空间方面胜出。

如果汽车之家的数据是对的,则ChatGPT的数据有很多错误。

再看文心一言说的:

奥迪 A6L 2023款 TFSI型的轴距为3024mm,车身长度为5038mm,宽度为1886mm,高度为1463mm;

宝马5系525Li 2022款的轴距为3105mm,车身长度为5106mm,宽度为1868mm,高度为1500mm。因此,在空间方面两者相差不大,但宝马5系525Li 2022款略胜一筹。

文心一言的数据也不全对,只是偏差比ChatGPT小一些。

还看一下油耗数据:

汽车之家的数据可以看出WLTC综合油耗奥迪是7.02(疑似为7.2),而宝马为7.4。奥迪胜出

之前说汽车之家的比较结论说宝马在油耗上胜出可能是错误的,就是因为有这两个数据比较。

来看一下ChatGPT的说法

奥迪 A6L 2023款 TFSI型的综合工况油耗为7.2L/100km。

宝马5系525Li 2022款的综合工况油耗为7.4L/100km。

奥迪 A6L在油耗方面略胜一筹。

这次,ChatGPT的数据和结论是正确的。

文心一言的说法

奥迪 A6L 2023款 TFSI型的工信部综合油耗为7.7L/100km;

宝马5系525Li 2022款的工信部综合油耗为7.9L/100km。

因此,在油耗方面两者相差不大,但奥迪 A6L 2023款 TFSI型略胜一筹。

文心一言的结论也是对的。但不知道它为什么会用工信部综合油耗这个指标。

总结

❶,做车型比较时,如果参照汽车之家的正确答案,文心一言的两车比较更靠谱些。

❷,大模型和垂直领域的结合还有不短的路要走。当要求参考汽车之家的品库来做比较,似乎对ChatGPT和文心一言没有什么作用,甚至出现不少数据错误。

❸,整体上,ChatGPT和文心一言都能正儿八经地给出结论,但结论是否靠谱,需要仔细分辨。

❹,未来大模型和垂直领域小模型的结合,有很大空间

懂保汇创想懂保汇创想以我本人的原创为主,偶尔转发其它内容。本公众号主要聚焦企业经营和管理、年轻人成长。同时,集中对保险行业的分析和探索。还有自己的创业感想。欢迎订阅!97篇原创内容

“ChatGPT和文心一言的汽车对比评价,谁更靠谱?-chat下载手机版” 的相关文章

"北约欧美?俄罗斯:不服来战!"

"北约欧美?俄罗斯:不服来战!"

40多个国家打一个俄罗斯,这是一个非常令人骄傲的事情。 然而,我们却认为,即使将顶级的世界国家加起来,也不是俄罗斯的对手。 欧美制裁俄罗斯 这种说法是否正确呢?首先,我们需要明确一点,俄罗斯并不是一个容易被打败的国家。在过去的几年中,俄罗...

2021年福建专升本考试报考流程

2021年福建专升本考试报考流程

2021年福建专升本考试报考流程 01 2021年专升本考试报名时间 02 操作步骤 步骤一:考生打开浏览器,输入网址http://www.eeafj.cn,登录福建省教育考试网。 步骤二:点击网页右侧服务大厅的“专升本招考”链接。如下图:...

对话360杭程:IE浏览器退役“后遗症”怎么破?

对话360杭程:IE浏览器退役“后遗症”怎么破?

日前IE浏览器退役登上热搜,有网友表示“一个时代结束了”,也有网友表示“喜大普奔”。部分用户对于IE浏览器即将退役表露出了些许担忧,例如一些考试报名网站如何登陆?还有网友指出:以后工程师写代码终于不用兼容IE了。 众说纷纭,但IE的没落是不争的事实,据相关数据显示,IE在全球台式电...

2月70城房价:商品住宅销售价格环比总体上涨

2月70城房价:商品住宅销售价格环比总体上涨

随着政策效果逐步显现及住房需求进一步释放,今年2月中国各线城市商品住宅销售价格环比总体上涨。 3月16日,国家统计局发布数据显示,70个大中城市中商品住宅销售价格环比上涨城市个数继续增加,各线城市商品住宅销售价格环比总体上涨,一线城市商品住宅销售价格同比上涨、二三线城市同比降幅收窄...

工行95588有假短信 防骗:进官网一个字母都不能错

工行95588有假短信 防骗:进官网一个字母都不能错

工行95588有假短信 网银安全受威胁 支招防骗:进官方网站一个字母不能错 襄阳汉江网讯(襄阳日报记者 李德荣)近一段时间,记者多次接到读者反映,骗子冒充银行客服电话发短信,引诱接收信息者进入骗子发来的钓鱼网站,受骗者如果按照短信的步骤进入钓鱼网站,其帐户上的钱会很快被骗...

百岁人民艺术家秦怡离世,众星发文悼念,与齐白石、老舍齐名

百岁人民艺术家秦怡离世,众星发文悼念,与齐白石、老舍齐名

默哀!中国再次损失一位人民艺术家,5月9日凌晨4时08分,获得“人民艺术家”称号的秦怡老师不幸在华东医院病逝,享年一百岁,众星发文悼念。据悉,是一位记者在上海市委宣传部获得的消息。 作为著名演员的秦怡是中国百年电影史的见证者和耕耘者,在97岁时获得中国“人民艺术家”的称号...