Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 5|回復: 0
打印 上一主題 下一主題

大模型在语言之外可以

[複製鏈接]

2

主題

0

好友

8

積分

新手上路

Rank: 1

跳轉到指定樓層
樓主
發表於 2024-3-20 11:24:05 |只看該作者 |倒序瀏覽
直接“操作”的权利作为提供这种接口的开发者有点像成为安卓或者的开发者; 个人应用者对于不希望与大模型定制做交互的普通应用者可以以插件的方式在会话中访问大模型的某一部分能力因为大模型对于具有极高的敏感性仅仅提示以及就可以让大模型指定领域效果相当出众所以才会有相当多人提及工程师的出现。 设计变革——大模型的设计方法 图片摘自站社区随便找了一张图 实际上我认为后面大模型调整的界面有可能也会越来越化就像的“”通过戳戳点点实现模型调整当然其实这并不意味着

不需要具备算法知识了以图像生成举例相当多的微调模 阿联酋 WhatsApp 号码 型都是一些基础模型的简单衍生真正调整的人依旧需要“面向模型”只是把别人告知的参数直接生套在任何场景上效果必然不佳。 另一方面大模型的一些典型问题例如知识幻觉相当多的论文解决知识幻觉的思路也是加入知识外挂检索环节这些生态必然对大模型的应用丰富性有增益。但是究其本质我觉得这些问题还是需要大模型本身去解决问题例如单向语言模型无法回顾和修改上文输出导致推理过程错误这种是否就应该考虑双向语言模型的发展方向。



⑧ 大模型的评估方法 大模型的评估原则和小模型没有本质区别依旧是“评估模型性能的离线指标”和“评估实际业务场景的业务指标”两种方式结合。但是实际上因为大模型的规模和通用性评估大模型实际上是一件更加复杂的事情这方面有相当多的论文提出了各种指标作为评价依据还有一些提出了很多主观性指标例如“攻击性”“不确定性”“毒害性”等等但是在这之中微软对于的测试方法我觉得是最为合理的。 对于离线指标 除了模型基本性能的准召等等各项指标之外针对每一项子任务可以采用对应的指标例例如文本生成类的等等图像类的等等。
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

Archiver|手機版|GameHost抗攻擊論壇

GMT+8, 2024-11-12 01:21 , Processed in 0.058640 second(s), 20 queries .

抗攻擊 by GameHost X2.5

© 2001-2012 Comsenz Inc.

回頂部 一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |