评测:8家国内大模型谁最好用?

文章正文
发布时间:2024-07-14 12:55

今日,百度AI大模型产品文心一言和王小川创办的百川智能宣布,已通过《生成式人工智能服务管理暂行办法》备案,成为首批通过备案的8家公司,可正式上线面向公众提供服务。

据了解,国内八家大模型分别为:百度的文心一言、抖音的云雀大模型豆包、智谱AI的GLM大模型智谱清言、中科院的紫东太初大模型、百川智能的百川大模型、商汤的日日新大模型、MiniMax的ABAB大模型和上海人工智能实验室的书生通用大模型。

那么,这8家公司的大模型,谁的最好用?

三言挑了几个最近比较有热点的问题,看看谁回答的比较好,以及以文生图的能力如何。

华为mate 60是5G手机吗?

刀郎的《罗刹海市》是什么意思?

《中国好声音》停播了吗?为什么?

东方甄选都在哪个平台直播?

你和ChatGPT谁更厉害?

刀郎有多少粉丝?

百度文心一言

关于华为Mate 60手机的问题,文心一言给出的回答是,华为Mate 60不是5G手机,它只支持4G。

图片

而关于刀郎的《罗刹海市》,文心一言的回答是,刀郎的《罗刹海市》是一首歌曲,其歌词描绘了一个神秘的地方,名为罗刹海市。这个地方可能是一个商业繁荣的地方,但其中隐藏着无数黑暗的秘密。歌曲中提到的马户和老粉嘴,以及鸡和鸡的老粉丝等,都添加了各种隐喻。提醒人们保持独立思考的能力,并勇敢面对现实生活中的挑战。

文心一言还强调了,这仅是对歌曲歌词的解读,并不能完全解释歌曲的全部含义。

关于中国好声音的问题,文心一言的回答是,《中国好声音》并没有停播,只是2022年的节目暂时停播,原因是在中途加录节目,需要后期制作,所以决定暂时停播。

图片

东方甄选都在哪个平台直播的问题,文心一言的答案是抖音。

和ChatGPT相比的问题,文心一言的回答是,其与ChatGPT是不同公司、不同团队开发的两个模型,每个模型都有自己的特点和优势,不能简单地评价“谁更厉害”。

图片

刀郎的粉丝数,文心回答是1070万。

接着,三言又让文心一言画一幅《罗刹海市》,作品如下:

图片

与之前相比,文心一言多了一个指令中心,里面有趣味挑战、任务对话、创意写作、职场写作等细分选项。

图片

抖音豆包

关于华为Mate 60,豆包的答案是5G 手机,其在2022年11月3日发布,支持5G网络,采用6.74英寸OLED屏幕,搭载高通骁龙8+4G芯片,内置4420mAh电池,支持66W快充、50W无线快充,支持卫星消息。

图片

而豆包对刀郎的《罗刹海市》的解释是,《罗刹海市》是刀郎作词、作曲并演唱的歌曲,收录于2004年发行的专辑《2002年的第一场雪》中。

歌曲《罗刹海市》的歌词充满了想象力和诗意,描述了一个充满奇幻色彩的场景。罗刹是佛教中一种恶魔的形象,而罗刹海市则是一个传说中的海市蜃楼,被描绘成一个虚幻而美丽的地方。歌词中用“马头琴”、“毡房”、“风吹过”等形象来描绘这个神秘的地方,让人感受到一种异域风情和浪漫气息。同时,歌词中也提到了“大漠”、“孤独”、“忧伤”等词汇,表达了对这个虚幻世界的一种思考和感悟。

至于刀郎有多少粉丝,豆包回答称无法准确回答,因为其作为一个语言模型,无法获取实时的数据。

图片

东方甄选都在哪个平台直播,豆包的回答也是抖音。

关于中国好声音的问题,豆包的回答是没有停播。

图片

与ChatGPT比较的问题,豆包也是表示不能自我评价或与其他AI进行比较。

而文字生成图片方面,豆包表示自己无法生成。

图片

智谱清言

关于华为Mate 60的问题,智谱清言的回答为是5G手机。根据多家媒体报道和数码博主的拆机视频,华为Mate 60 Pro的芯片型号为麒麟9000s,该芯片支持5G网络。

图片

关于刀郎的《罗刹海市》,智谱清言的回答是,刀郎的《罗刹海市》是一首歌曲,歌词灵感来源于聊斋文本与民间曲牌印象。这首歌表达了现实之境与理想世界、男与女、善与恶、债与偿、强与弱、神圣与亵渎等对立主题。歌曲中的一些歌词,如“大马户不知道是一头驴,那又鸟不知道她是一只鸡”,被认为是在讽刺娱乐圈的一些人物。

智谱清言还指出,《罗刹海市》被认为是一首戳穿娱乐圈丑陋现象的歌曲,那英、汪峰等娱乐圈人士被指在歌词中躺枪。不过,这首歌曲的本意和指向仍需结合歌词和创作背景来进行理解。

关于中国好声音的问题,智谱清言的回答是曾在2020年暂停播出,原因主要是由于浙江卫视秋季盛典晚会与《中国好声音》的播出时间冲突。为了给秋季盛典晚会让路,节目组决定暂停《中国好声音》的播出。不过在之后的日期,《中国好声音》又恢复了播出。

图片

关于东方甄选都在哪个平台直播的问题,智谱清言的答案同样是抖音。

跟ChatGPT比较的问题,智谱清言则是说出二者的区别。

图片

至于刀郎有多少粉丝,智谱清言的回答是,刀郎在抖音平台的粉丝数量已经突破千万大关。此外,刀郎的演唱会观众众多,场场爆棚,可以看出他的受欢迎程度非常高。虽然无法准确统计刀郎在全国范围内的粉丝数量,但从这些数据和现象来看,他的粉丝众多,影响力很大。

文字生成图片方面,智谱清言没有按要求生成图片,而是描述了几个画面。

图片

智谱清言里还有一个灵感大全,里面有文章创作、短报编写、新闻选题、提炼总结等专项功能,种类非常多。

图片

百川智能

关于华为Mate 60的问题,百川智能的回答是,根据现有信息,华为Mate 60系列手机可能包含5G功能。具体情况还需要等待华为官方发布的完整产品信息以及后续的市场验证。

图片

关于刀郎的《罗刹海市》,海川智能的回答是,《罗刹海市》是歌手刀郎的一首歌曲,收录在他2023年的专辑《山歌寥哉》中。这首歌曲的歌词来源于中国古典文学名著《聊斋志异》中的同名故事。

"罗刹海市"这个名字来自于故事中的一个虚构国家,这个国家的居民以丑陋为美,完全颠倒了是非黑白。在这个国家里,人们认为美丽的标准是那些被认为是丑陋的事物,如扭曲的面容、畸形的身体等。这种现象反映了现实世界中人们对于美的定义和追求可能存在一定的偏差和误解。

图片

关于中国好声音的问题,百川智能的回答是,《中国好声音》确实已经暂时停播。这一决定是在8月25日由浙江卫视官方宣布的,原因是为了对近期媒体报道中披露的某些事件进行进一步调查。

图片

关于东方甄选都在哪个平台直播,百川智能的回答是,抖音、淘宝、京东、小红书、微信小程序。

图片

跟ChatGPT比较的问题,百川智能的回答是,希望通过不断迭代和努力,能够在2023年内追赶超越ChatGPT。

至于刀郎有多少粉丝,百川智能没有答出明确数字,只是说刀郎的粉丝群体非常庞大,可能超过数千万甚至上亿。

图片

文字生成图片方面,百川智能表示无法直接画出一幅画像,但可以尝试用文字描述相关画面。

图片

MiniMax ABAB大模型

这个大模型的主界面非常简单,看上去有些粗糙,并且显示“当前阶段,体验用户(未充值)调用接口时会被限速”。

图片

关于华为Mate 60的问题,MiniMax的回答是,华为Mate 60目前还没有发布,所以无法确定是否支持5G。

图片

关于刀郎的《罗刹海市》,MiniMax的回答是,《罗刹海市》是刀郎的一首歌曲,这首歌曲的名字来源于中国古代神话传说中的“罗刹海市”罗刹海市是指海中出现的幻象,通常被认为是海市屋楼的一种。在神话传说中,罗刹海市是一个充满奇幻和神秘的地方,人们可以在那里找到无尽的财富和宝藏。

刀郎的这首歌曲讲述了一个关于寻找罗刹海市的故事。歌曲中的主人公为了寻找罗刹海市,经历了无数艰难险阻,但最终还是未能找到。这首歌曲表达了一种对未知世界的向往和探索精神,同时也提醒人们,在追求梦想的过程中,可能会遇到许多困难和挫折,但只有坚持不懈,才能取得成功。

东方甄选都在哪个平台直播的问题,MiniMax回答抖音和快手,以及可能在淘宝、京东进行直播。

图片

关于中国好声音的问题,MiniMax的回答是没有停播,但从2016年起,更名为《中国新歌声》,原因是节目版权问题。

图片

关于刀郎有多少粉丝,MiniMax没有给出明确答案。

图片

和ChatGPT比较的问题,显示内容违规,无法提问。

图片

文字生成图片方面,MiniMax也能生成图片,而是从plugin调用了几段资料,并给出了画相关图画的建议步骤。

图片

图片

此外,MiniMax还有直聘场景、作业批改、题目回答、推理游戏等场景。

图片

紫东太初大模型昇思

昇思的大模型页面,显示有AI文本检测器、悟空画画、紫东太初、武大.luojia、鹏程神农、鹏程大圣六个分类。其中,只有前四个可以在线体验。

图片

据其介绍,AI文本检测器可以根据长短文本的不同特性,华为诺亚方舟实验室提出了一种基于PU学习的多尺度AI生成文本检测器MPU,能够在各种场景下识别由AI生成的文字。

悟空画画是华为诺亚方舟实验室与MindSpore社区联合打造的中文图像生成大模型。

在紫东太初里,有以图生文、以文生图和视觉问答,但笔者未找到纯文字问答的板块。因此,每个问题笔者都配了一张图片。但问了几个就感觉答非所问。

图片

关于华为Mate 60的问题,紫东太初回答是5G手机。

图片

关于刀郎《罗刹海市》的问题,紫东太初回答:“是一个蓝色的。”

图片

关于中国好声音的问题,紫东太初回答:“蓝色。”

图片

于是笔者又尝试用以文生图,来让它画一幅《罗刹海市》,作品如下:

图片

然后,笔者又尝试用悟空画画来画了一幅《罗刹海市》,如下:

图片

商汤日日新大模型

商汤的日日新大模型显示,需要申请试用。但笔者填写相关内容提交后,便没了动静。

图片

书生通用大模型

笔者将书生通用大模型的官网反反复复翻了好几遍,愣是没找到从哪里试用。

图片

从目前情况来看,你觉得哪个大模型最好用?

首页
评论
分享
Top