OpenAI 的研究发现,美国用户每天向 ChatGPT 发出近 300 万条有关薪酬和收入的问题,主要用于把零散工资信息转化为可比较的基准,以及评估岗位、公司或创业可能的收入。研究还通过隐私保护的自动分类分析了问题分布,并推出 WorkerBench 基准以评估模型在劳动力市场任务上的表现,结果显示模型在国家和城市级别的工资估算上覆盖率高且误差小。
背景
– 工资信息影响求职、谈判和职业选择,但劳动力价格常常难以获取和解读,尤其对职业早期、转行或迁移的工作者。
用户行为洞见
– 美国用户每天平均向 ChatGPT 发送近 3,000,000 条与薪酬相关的信息请求。
– 两类主要需求:把薪酬转化为可用基准(如工资计算)以及评估岗位/公司/职业/创业的现实收入预期。
– 在标注的薪酬基准查询中,构成比例:工资计算 26%、具体岗位 19%、创业 18%、公司内具体岗位 11%、职业类问题 11%。
– 工种分布:艺术设计、娱乐与媒体、管理、医疗、运输、销售、商业与金融等领域的查询密集;高技能且薪酬透明度低的职业(创意类、管理、医疗、计算与数学)查询比重更高。
影响与意义
– 工资查询集中在薪酬分散或较高的行业,表明工人更在意并更难获得准确信息的场景使用 AI 辅助。
– 更好的薪酬信息能降低误判导致的职业停滞、谈判力不足或投资教育决策失误,但无法完全消除不确定性。
方法与评估
– 采用隐私保护的自动分类方法分析消息,未由人工查看单条消息。
– 引入 WorkerBench 基准:在国家与城市层面,用 2024 年 OEWS 中位工资对 GPT‑5.4 进行评估,结果显示覆盖率高、偏差小,数值估计大多接近基准。
后续方向
– OpenAI 目标是提升信息的实用性与可靠性,从国家级基准扩展到更精细的地理、公司层面和具体补偿问题,以更贴近用户日常需求。
AI 在填补薪酬信息空白上展现潜力,但需要持续提升地域与公司层面的精细化准确度。