近期,宠物行业测评PDEM发布百目魔君大模型V3.0测评报告。本次测评以其早前版本V2.0为基线,对汪喵灵灵自主研发的“百目魔君”大模型V3.0进行了为期4周的封闭与开放环境双重测试。结果显示,百目魔君大模型V3.0在多模态问诊、精准循证诊断及用户体验三大维度均实现跨越式升级,整体诊断能力较V2.0提升约10%,诊断准确度达到90%以上,并基本消除模型幻觉。
百目魔君大模型V3.0测评核心结论
1.数据量级再扩容:新增1亿token高质量循证诊疗数据,覆盖犬猫全科常见病及罕见病,强化动物医学知识图谱覆盖。
2.双模引擎:首创“深度模式”与“即时响应”融合架构,用户可按场景一键切换——复杂病例进入深度模式,96K超长上下文实现“类真人兽医”递进问诊;日常咨询启用即时响应,2秒内完成初筛。
3.循证路径零偏差:模型严格遵循循证医学原则进行问诊,每一步提问、排除、确认均形成可追溯、可视化的循证依据。
4.幻觉抑制:通过检索增强生成与强化学习联合调优,基本消除模型幻觉现象,有效保障诊断解决准确性。
5.诊断专业性:在100例真实回顾性病例盲测中,百目魔君大模型V3.0的诊断与真人兽医判断结果一致性达90%以上。
测评问诊案例场景回放
在PDEM测评的主诉“狗狗屁股鼓包”案例中,百目魔君大模型通过多轮对话完成精准诊断闭环:
• 智能甄别:基于主诉自动列出“会阴疝、肛门腺炎、囊肿、肿瘤”4种高概率疾病;
• 类真人兽医思维:循证提问“鼓包硬度”“是否舔舐”“排便表现”等关键指征;
• 精准推理:根据“排便时鼓包体积明显变化”锁定会阴疝;
• 最终确认:输出会阴疝循证高确信等级,并给出就诊紧迫度、检查建议及护理要点。
PDEM测评点评
在宠物医疗AI赛道,汪喵灵灵首次把循证医学的严谨性与大模型的灵活性真正结合起来,这种将医学逻辑链嵌入AI交互的能力,在宠物医疗领域尚属首例。其“问诊-验证-确认”的闭环逻辑与诊断专业能力,已接近执业6年以上兽医的平均水准。
汪喵灵灵团队表示,百目魔君大模型V3.0只是起点,团队将继续深耕循证数据与多模态交互,让AI成为每一位宠主和兽医值得信赖的第二诊疗意见。
百目魔君大模型的持续升级,无疑为宠物诊疗领域带来了更高效、精准的辅助工具,有望在宠物健康保障落地场景发挥重要作用。
【广告】免责声明:本内容为广告,不代表蚌埠新闻网的观点及立场。所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。蚌埠新闻网登载此文出于传递更多信息之目的,对此文字、图片等所有信息的真实性不作任何保证或承诺。文章内容仅供参考,不构成投资、消费建议。据此操作,风险自担!!!
蚌埠新闻网版权所有未经允许 请勿复制或镜像
皖ICP备07008681号-1 皖网宣备070018号 皖公网安备34030002000168号
互联网违法和不良信息举报: 举报邮箱 bbrbs@bbnews.cn 举报电话 (0552)4017493