GoForum › 用户主页

sillydaddy

加入时间: 2025-12-26 (4个月前) 当前积分: 100 Lv0

所以,Elo 用在围棋比赛、赛车比赛时,就是绝对实力的差距。因为 1 场比赛,赢就是赢输就是输,不分情况。但用在编程上时,因为是先给定题目,再 PK ,那题目的选择就是比赛的关键变量,出简单题目 PK 与出难题 PK ,结果会不一样,导致分数计算也不一样。

Arena 的 PK 是类似于众包,…

查看完整回复 →

换句话说,如果你自己平时用的时候,问的问题的难度分布(比如 1 个超级简单的,10 个中等难度的,3 个架构设计的),与 Arena 用户在对答案投票时,问的问题难度分布(比如 2 个超级简单的,18 个中等难度的,5 个架构设计的)类似,那这个分数就很适用,分差完美反映了 2 者的实力差距。

查看完整回复 →

Elo 评分还是比较可靠的:Elo 基本是所有赛事都常用的评分机制:围棋、游戏、赛车等等。 这个分数,表明了 2 个对手比赛时的胜率。

Elo 胜率公式:胜率 = 1 / (1 + 10^(分差/400))

Elo 相差 10 分 胜率 51.4% vs 胜率 48.6%,优势比较均衡…

查看完整回复 →
回复了帖子 cursor 变烂了 · 6天前

这话怎么说?

万有引力:为什么这么小的空间里聚集了这么多的飞船? 魔戒:海干了鱼就要聚集在水洼里,水洼也在干涸,鱼都将消失。

万有引力:所有的鱼都在这里吗? 魔戒:把海弄干的鱼都不在了。

万有引力:对不起,这话很费解。 魔戒:把海弄干的鱼……已经上岸,它们有无限的 token 可以用!

查看完整回复 →

这创意!请接受我卑微的打赏。

回复了帖子 自媒体这碗饭真不是谁都吃的下的 · 14天前

可以在 v 站先练练。多发帖,多被批、驳、喷、怼,习惯就好了,有些伤害度低的基本免疫,那些不免疫的恢复起来也很快。

查看完整回复 →

感谢分享。 「按会话+周度双维度按 Token 限制,与高级请求额度独立计算」,没看懂这里的限额是什么意思,Pro 不是一直是 10 美元 300 次吗?

查看完整回复 →

登录后可发帖和回复

登录 注册
用户统计
10
发帖
97
回复
加入于 2025-12-26 (4个月前)