广场
最新
热门
资讯
我的主页
发布
扫码下载 APP
更多下载方式
今天不再提醒
胡 杨
2025-08-06 11:25:34
关注
大模型要变聪明,得靠人教人管——这就是 Human-in-the-loop RL。
我最近在 @JoinSapien 上做了个任务,是审一段AI写的推理过程:
🌱 AI是怎么想的?
🌱 合不合逻辑?
🌱 哪一步开始歪了?
这种任务叫 CoT(Chain-of-Thought)评估,我就是它的逻辑审计员。
再进一步,还有 Tree of Thoughts(树状推理路径),AI会尝试多个想法分支,人类来筛哪条路径最好。
其实你可以当做你在给一个小孩讲题,但这小孩是GPT级别的未来大脑。
这活,AI自己干不了,人必须参与。
@JoinSapien
#sapien @KaitoAI #
KaitoAI #SapienProtocol
IN
-13.76%
TREE
-0.2%
GPT
4.84%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
0/400
评论
暂无评论
话题
#
BTC重返12万
3k 热度
#
ETH突破4300
2k 热度
#
晒出我的Alpha积分
77k 热度
#
稳定币流通量破2700亿美元
180 热度
#
美财长预计10月解决贸易问题
102 热度
置顶
道金斯说的「模因」,可以书里是一句话、歌曲里的一段旋律、一幅画中的意境、或者电影里的一幕桥段。「回首向来萧瑟处,归去,也无风雨也无晴」,苏东坡的词能流传千年,靠的不是基因遗传,而是通过人类模仿与传播而延续下来。
Gate 链上赚币:ETH 挖矿限时高收益!
✅ 年化收益近 5% + 额外奖励单人额度 1000 ETH
💎 最低 0.00000001 ETH 起投,无赎回期,随存随取!
立即上车,稳赚链上收益:https://www.gate.com/staking/ETH
网站地图
大模型要变聪明,得靠人教人管——这就是 Human-in-the-loop RL。
我最近在 @JoinSapien 上做了个任务,是审一段AI写的推理过程:
🌱 AI是怎么想的?
🌱 合不合逻辑?
🌱 哪一步开始歪了?
这种任务叫 CoT(Chain-of-Thought)评估,我就是它的逻辑审计员。
再进一步,还有 Tree of Thoughts(树状推理路径),AI会尝试多个想法分支,人类来筛哪条路径最好。
其实你可以当做你在给一个小孩讲题,但这小孩是GPT级别的未来大脑。
这活,AI自己干不了,人必须参与。
@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol