查看: 12|回復: 0

大模型在语言之外可以

2 主題	0 好友	8 積分

新手上路

Rank: 1

發消息

電梯直達

樓主

發表於 2024-3-20 11:24:05 |只看該作者 |倒序瀏覽

直接“操作”的权利作为提供这种接口的开发者有点像成为安卓或者的开发者；个人应用者对于不希望与大模型定制做交互的普通应用者可以以插件的方式在会话中访问大模型的某一部分能力因为大模型对于具有极高的敏感性仅仅提示以及就可以让大模型指定领域效果相当出众所以才会有相当多人提及工程师的出现。设计变革——大模型的设计方法图片摘自站社区随便找了一张图实际上我认为后面大模型调整的界面有可能也会越来越化就像的“”通过戳戳点点实现模型调整当然其实这并不意味着

不需要具备算法知识了以图像生成举例相当多的微调模 阿联酋 WhatsApp 号码 型都是一些基础模型的简单衍生真正调整的人依旧需要“面向模型”只是把别人告知的参数直接生套在任何场景上效果必然不佳。另一方面大模型的一些典型问题例如知识幻觉相当多的论文解决知识幻觉的思路也是加入知识外挂检索环节这些生态必然对大模型的应用丰富性有增益。但是究其本质我觉得这些问题还是需要大模型本身去解决问题例如单向语言模型无法回顾和修改上文输出导致推理过程错误这种是否就应该考虑双向语言模型的发展方向。

⑧ 大模型的评估方法大模型的评估原则和小模型没有本质区别依旧是“评估模型性能的离线指标”和“评估实际业务场景的业务指标”两种方式结合。但是实际上因为大模型的规模和通用性评估大模型实际上是一件更加复杂的事情这方面有相当多的论文提出了各种指标作为评价依据还有一些提出了很多主观性指标例如“攻击性”“不确定性”“毒害性”等等但是在这之中微软对于的测试方法我觉得是最为合理的。对于离线指标除了模型基本性能的准召等等各项指标之外针对每一项子任务可以采用对应的指标例例如文本生成类的等等图像类的等等。

收藏0

阿联酋 WhatsApp 号码

回復

使用道具舉報

返回列表

		自動登錄	找回密碼
密碼			立即註冊