收藏列表 (0)
还没有人收藏过本帖~
本次评测旨在比较三个AI选手——讯飞星火、KIMI、DeepSeek,使用相同的提示词,在生成含有关键词“投稿”的高质量文章标题方面的表现。每个AI选手被要求生成100个不重复的标题,关键词“投稿”可以出现在标题的任意位置,标题风格和长度不限。
评测指标:生成标题的多样性、创新性、相关性以及是否满足不重复的要求。
评测过程:对每个AI选手生成的标题进行分析,检查其是否符合要求,并记录下出现的问题。
一号选手:讯飞星火
结论:前半段表现正常,后半段出现混乱,疑似算法失控,建议增加内存以改善性能。整体表现不及格。
表现:前50个标题符合要求,后50个标题出现重复和不相关的内容。
二号选手:DeepSeek
结论:前半段标题围绕期刊投稿有序生成,后半段出现大量重复标题。整体表现勉强及格。
表现:前50个标题质量较高,后50个标题中有多处重复。
三号选手:KIMI
结论:在三个选手中表现最好,后半段开始出现重复标题,但整体质量较高。
表现:前50个标题质量高,后50个标题中出现一些重复。
创新性与多样性:KIMI在创新性和多样性方面表现最佳,生成的标题覆盖了多种风格和体例。
相关性:所有AI选手在相关性方面均表现良好,大部分标题都紧密围绕“投稿”这一关键词。
不重复性:DeepSeek和KIMI在后半段出现了重复标题,讯飞星火在后半段出现了算法失控的情况。
在本次评测中,KIMI的表现最为出色,尽管后半段也出现了一些重复标题,但整体质量高于其他两位选手。DeepSeek的表现中等,而讯飞星火则需要在算法稳定性和性能上进行改进。
讯飞星火:请考虑增加服务器内存到32G,必须16G*2双通道(开个玩笑),优化算法,提高生成标题的稳定性和质量。
DeepSeek:优化算法以减少重复标题的出现,提高标题的创新性。
KIMI:继续保持高质量输出,同时进一步优化算法以减少重复标题。
通过整合DeepSeek和KIMI生成的标题并去重后,我们得到了50个不重复的高质量标题。感谢各位选手的的帮助。