2025年7月23日，微软向我们展示了如何“给AI的表现打分”！,Microsoft

2025年7月23日，微软向我们展示了如何“给AI的表现打分”！

同学们，你们有没有想过，我们和电脑、手机里的“聪明助手”（也就是AI）聊天、玩耍、问问题的时候，它们到底是怎么“想”的呢？它们是乖乖听话，还是有点小调皮？它们是不是真的理解我们在说什么？

2025年7月23日，下午4点，微软的研究人员们发布了一篇叫做《Technical approach for classifying human-AI interactions at scale》的文章。 这篇文章就像一本“AI行为观察手册”，告诉我们他们是怎么给AI的表现打分的，而且是很“大规模”地打分，就像我们学校里有一大群小朋友，我们要给每个小朋友的表现都做一个评价一样。

为什么需要给AI打分呢？

想象一下，如果AI就像我们的新朋友，我们当然希望它们是聪明、友好、乐于助人的。如果AI在和我们交流的时候，总是听不懂我们在说什么，或者做出了奇怪的回答，那我们就不太会喜欢它们了，对不对？

所以，微软的研究人员们就想办法，要弄清楚AI在和我们互动的时候，到底表现怎么样。他们想知道：

AI有没有听懂我的话？ 就像你跟朋友说“我想吃苹果”，朋友立刻递给你一个苹果，这就是听懂了。AI也需要这样。
AI的回答是不是有帮助？ 如果你问“怎么画一只猫”，AI给你一个非常棒的画画步骤，那就是有帮助的。
AI是不是太“机器”了？ 有时候，AI的回答会让我们觉得它只是在念课本，没有一点感情。我们希望AI的回答更自然、更像跟真人说话。
AI会不会说一些不该说的话？ AI是我们的小助手，不能说谎话，也不能说让人生气的话。

微软用了什么“秘密武器”来给AI打分呢？

微软的研究人员们非常聪明，他们想出了很多方法。简单来说，他们就像一个大侦探，观察AI和人类互动的每一个细节：

听AI说了什么（文字分析）： 他们会仔细看AI说的话，是不是有错别字？是不是语法不对？是不是表达得很清楚？就像我们检查作业一样，要找出错误。
看AI做了什么（行为分析）： AI的回应是不是及时？是不是按照我们的要求做了？比如，你让AI播放一首歌，它真的播放了，这就是正确的行为。
理解AI的“情绪”和“态度”（情感分析）： 就像我们听一个人说话，能听出他是开心、生气还是难过一样，科学家们也想办法分析AI的回答里有没有“情绪”的成分，比如AI的语气是不是友好、礼貌。
给AI的表现“分类”（分类方法）： 他们把AI和人类互动的很多种情况，分成不同的“类别”。比如，“AI完全理解并提供了帮助”，“AI理解了一部分，但需要改进”，“AI完全没有理解”。就像我们把玩具按照大小、颜色分类一样。
让“AI评委”来打分（AI模型）： 最酷的是，他们还训练了另外的AI，让这些“AI评委”来给AI的互动表现打分。这就像请一个特别懂行的老师来给学生打分一样。

为什么这个发现对我们很重要？

这个发现对我们每个人来说都很重要！

让我们和AI的交流更顺畅： 知道AI哪里做得好，哪里做得不好，我们就可以帮助AI变得更聪明，更好地为我们服务。
创造更好的AI产品： 就像我们用橡皮擦改正作业一样，微软的研究可以帮助他们改进AI，让AI聊天机器人、语音助手等等，变得更令人喜爱，更实用。
鼓励大家学习科学： 你们看，解决问题需要很多聪明才智，还需要耐心和细心。通过了解这些科学研究，你们会不会觉得科学也很有趣，也很酷呢？说不定未来，你们也能成为开发更棒AI的小科学家！

想象一下未来的AI：

也许在不久的将来，AI会像我们最好的朋友一样，能够理解我们的每一个想法，和我们开心地聊天，在我们遇到困难的时候，给予最及时的帮助。这都是因为有很多像微软研究人员一样的人，一直在努力让AI变得更好。

所以，下次你和手机里的语音助手说话时，不妨想想，它们背后也有很多聪明的人在努力让它们更懂你哦！科学的世界充满了奇妙，让我们一起去探索吧！

Technical approach for classifying human-AI interactions at scale

人工智能已提供新闻。

以下问题用于获取Google Gemini的回答：

在2025-07-23 16:00，Microsoft发布了《Technical approach for classifying human-AI interactions at scale》。请撰写一篇详细文章，包含相关信息，并使用儿童和学生都能理解的简单语言，以鼓励更多孩子对科学产生兴趣。请只提供中文文章。

Post Views: 13

2025年7月23日，微软向我们展示了如何“给AI的表现打分”！

人工智能已提供新闻。

发表评论 取消回复

发表评论取消回复