想象一下,您正在参加一个充满活力的鸡尾酒会,局间充满了热烈的谈话声和玻璃杯碰撞的叮当声。
此时,您作为一个悠闲的观察者,怡然自得地躲在角落里。然而,就算没有处在聚会的中心,您还是可以轻松地弄清楚不同人之间的社会关系,了解正在发生的事情,甚至通过阅读人们的言语和非言语线索来读懂明里暗里的社交信息。
如果一个LLM能够复现这种水平的社交能力呢?这不,Koko Mind就是这么个东西。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
随便打开一个视频,该模型就开始分析人物表情,得出人物情绪的结论。
然后,在右侧的prompt栏还可以提出问题,让AI进一步分析视频中暗流涌动的社交谜题。
(说实话对有些人来说这都很难)
图片
Kok
o Mind包含了150个复杂的多方社交互动以及自由文本问题和答案。
为了确保数据的多样性和可扩展性,并避免数据污染,所有社交互动、问题和答案均由GPT-4生成,并随后由人类专家验证。
分析数据基于三个不同的来源:
-
GPT-4-only:该子集仅由 GPT-4 通过提示创建。
-
基于电影:为了避免数据污染,这部分数据基于从2025年之后上映的电影中提取的各种场景。GPT-4负责塑造这些场景,在保留核心本质的同时添加了自己的元素。
- 基于 ToMi:该部分包含由模拟数据集ToMi支持的数据,其中涉及将物理对象移动到不同的地方,这是心理理论的经典测试。当然,这些社交互动还得被GPT-4修饰和扩展一下。
三种数据来源的占比如下:
图片
对于每次社交互动,研究人员都会提出各种问题,旨在探讨以下几个和社交理解息息相关的方面。
-
心理理论:评估对其他人心理状态和观点的理解的问题。
-
社会规范:旨在辨别情境中的社会价值观和规范的问题。
-
情绪识别:旨在识别和理解上下文中的情绪元素的问题。
-
社会关系:关注人际动态和关系。
-
反事实问题:旨在探索替代结果或可能性的假设查询。
- 社会建议:提出与特定情况相关的建议或行动建议的问题。
研究人员以text-d*inci-003 作为参考,评估了AlpacaEval后的不同模型。
其中,研究人员从上下文中删除了括号中的非语言线索(例如,紧张地喝咖啡等)。
以下则是一些有趣的要点:
-
在两个模型中,与Claude相比,GPT-4在识别获胜模型方面表现出更大的确定性和信心。
-
当上下文没有非语言线索,且交互要么完全由GPT-4生成,要么基于电影时,Claude的表现优于 GPT-4。
- 而如果上下文包含了非语言线索,那GPT-4总是比Claude更好。
(一种可能的解释是,GPT-4是一种多模态模型可以更好地理解额外的非语言信息。)
在博客中,研究人员绘制了表格,可以清晰的看到各个模型的表现。
图片
结果虽然在很多方面都令人兴奋,但也有一定的局限性。首先, Koko Mind的规模相对较小,这可能会限制研究人员结论的广泛适用性和全面性。
其次, Koko Mind中的所有交互都是由GPT-4生成的,需要人工验证,这使得数据集难以扩展。
另外,虽然Koko Mind在数据集中提供了经过人工验证的答案,研究人员在评估时没有使用这些答案作为参考,并且由于这些答案是由GPT-4生成的,因此它们可能会偏向GPT-4。
未来的研究可以集中在如何评估模型上具有经过人工验证的机器生成的参考答案。
当然,虽说存在这样或那样的限制,研究人员仍将Koko Mind视为未来与社会智能、多模态语言模型等相关的研究的跳板。
以上就是「社交达人」GPT-4!解读表情、揣测心理全都会的详细内容,更多请关注其它相关文章!
# 社交
# 韩国影视网站建设
# 推广博彩网站seo
# 展览设计网站建设
# 小店区seo优化资费
# 青竹湖项目营销推广案
# 这是
# 怎么处理
# 社会关系
# 重庆
# 自定义
# 是由
# 老照片
# 互动
# 自己的
# 达人
# claude
# gpt-4
# 中山专业网站建设
# 汕尾seo优化营销
# 网站推广广告词怎么说的
# 建设网站培训总结ppt
# 麻城石材网站推广
相关栏目:
【
企业资讯168 】
【
行业动态20933 】
【
网络营销52431 】
【
网络学院91036 】
【
运营推广7012 】
【
科技资讯60970 】
相关推荐:
泗洪:畅通城市“血管” ,管下机器人来帮忙
再度重仓 AI 赛道,SaaS 巨头 Salesforce 扩大 AIGC 风投基金规模
美图第二届影像节发布七款AI影像创作工具
Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务
7条线路感受智慧美好生活,“2025 世界人工智能大会民营企业社会开放日”主题活动启动
亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资
消息称 ChatGPT 未来有望增加更多功能:上传文件分析信息,还能记住用户画像
解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能
腾讯自主研发机器狗 Max 升级,可“奔跑跳跃”完成避障动作
利用AI技术更好地发展农村电商
再也不怕「视频会议」尬住了!谷歌CHI顶会发布新神器Visual Captions:让图片做你的字幕助手
九号公司主导制定短途交通和送物机器人领域首个国际标准,标志着零的突破发布
腾讯机器狗进化:通过深度学习掌握自主决策能力
Ai智能机器人,chat-免注册登入,直接使用新版gpt4.0!
赋能选题探索:AI助手在经济学专业中的应用指南
周鸿祎:用超级AI实现室温超导和核聚变,实现能源自由
世界人工智能大会中西部县域数字就业中心组团亮相
中国移动主导创立元宇宙产业联盟,包括科大讯飞、芒果TV等在内,共24家成员
意大利警察拟用AI预测犯罪 该算法被指种族歧视严重
利好来了,AI再起一波?
普林斯顿Infinigen矩阵开启!AI造物主100%创造大自然,逼真到炸裂
云鲸发布全新的扫拖机器人J4系列
阿里大文娱CTO郑勇:生成式AI将引发内容行业巨变,*制作机会挑战并存
Databricks推出人工智能模型共享机制,可令开发者与公司“双赢”
昌吉市利用无人机实现全天候河道动态巡检
全新“AI助手”!讯飞星火助手中心人机协作共创新生态
探展WAIC | 第四范式“式说”聚焦toB大模型,布局生成式AI重构企业软件
抛媚眼给瞎子看?微软、谷歌的AI广告被广告主抵制
报道称亚马逊正在测试AI生成产品评价摘要
Xbox游戏工作室负责人:VR/AR领域的用户规模还不足够
视觉中国推出AI灵感绘图功能,付费后可在“合法合规前提下使用”
调查:过半数艺术家认为 AI 作图无法帮助他们的工作
掌阅科技对话式AI应用“阅爱聊”开启内测
生成式AI引路产业加速来袭,微美全息探索“AIGC+虚拟人”融合应用
华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来
微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
家电行业观察:AI加持下,全屋智能将成为智能家电未来?
WHEE上线时间介绍
全面拥抱大模型浪潮,ISC 2025打造全球首场AI数字安全峰会
RoboNeo操作教程
优地网络助力新媒体拥抱人工智能时代
人工智能进入绿植界,智能庭院市场初具规模
"探索Meta发布的Quest MR/VR视频录制与拍摄指南"
国家发改委组织工业机器人产业高质量发展现场会
WHEE网页地址入口
苹果2万5的AR遭遇砍单95%:不及预期
华为盘古AI模型实现秒级全球气象预报时间缩短
科技数码圈的新物种 乐天派桌面机器人 AI +安卓+机器人 首发价1799元
尼康尼克尔Z 180-600mm f/5.6-6.3 VR镜头发布:12499元 拍鸟神器
OpenAI高管:AI能创造新的就业机会 但也会淘汰一些


