0 1

AI模型PK评测报告:让讯飞星火、KIMI、DeepSeek生成100个标题,你更看好谁?

AI助手 1月前 115

AI模型PK评测报告

评测背景

本次评测旨在比较三个AI选手——讯飞星火、KIMI、DeepSeek,使用相同的提示词,在生成含有关键词“投稿”的高质量文章标题方面的表现。每个AI选手被要求生成100个不重复的标题,关键词“投稿”可以出现在标题的任意位置,标题风格和长度不限。

评测方法

  • 评测指标:生成标题的多样性、创新性、相关性以及是否满足不重复的要求。

  • 评测过程:对每个AI选手生成的标题进行分析,检查其是否符合要求,并记录下出现的问题。

评测结果

一号选手:讯飞星火

  • 结论:前半段表现正常,后半段出现混乱,疑似算法失控,建议增加内存以改善性能。整体表现不及格。

  • 表现:前50个标题符合要求,后50个标题出现重复和不相关的内容。

 

二号选手:DeepSeek

  • 结论:前半段标题围绕期刊投稿有序生成,后半段出现大量重复标题。整体表现勉强及格。

  • 表现:前50个标题质量较高,后50个标题中有多处重复。

 

 

三号选手:KIMI

  • 结论:在三个选手中表现最好,后半段开始出现重复标题,但整体质量较高。

  • 表现:前50个标题质量高,后50个标题中出现一些重复。

综合分析

  • 创新性与多样性:KIMI在创新性和多样性方面表现最佳,生成的标题覆盖了多种风格和体例。

  • 相关性:所有AI选手在相关性方面均表现良好,大部分标题都紧密围绕“投稿”这一关键词。

  • 不重复性:DeepSeek和KIMI在后半段出现了重复标题,讯飞星火在后半段出现了算法失控的情况。

 

结论

在本次评测中,KIMI的表现最为出色,尽管后半段也出现了一些重复标题,但整体质量高于其他两位选手。DeepSeek的表现中等,而讯飞星火则需要在算法稳定性和性能上进行改进。

后续建议

  • 讯飞星火:请考虑增加服务器内存到32G,必须16G*2双通道(开个玩笑),优化算法,提高生成标题的稳定性和质量。

  • DeepSeek:优化算法以减少重复标题的出现,提高标题的创新性。

  • KIMI:继续保持高质量输出,同时进一步优化算法以减少重复标题。

通过整合DeepSeek和KIMI生成的标题并去重后,我们得到了50个不重复的高质量标题。感谢各位选手的的帮助。

收藏列表 (0)
还没有人收藏过本帖~
最新回复 ( 0 )
发新帖