清晨七点的宿舍还浸在薄雾里,季昭星已经坐在梳妆台前,对着镜子细细描眼线。林薇翻了个身,看着她睫毛上沾着的细闪粉,含混不清地笑:“至于这么隆重吗?又不是去见投资人。”
季昭星没回头,指尖蘸取豆沙色唇釉,在唇上晕开柔和的弧度。镜中的女孩眼尾微微上挑,脸颊扫过浅杏色腮红,连耳垂都特意抹了点珠光——这是她昨晚对着美妆教程练了半宿的成果。湖蓝色长裙挂在床头,裙摆上的星纹在晨光里泛着细碎的光,像仲月清代码里那些罕见的注释符号。
“饿不饿?我带了三明治。”林薇把早餐袋推过来,却被她轻轻挡开。
“不了,穿裙子显胖。”季昭星对着镜子转了半圈,裙摆扫过地面时带起一阵风。她摸了摸平坦的小腹,想起前世舞会合照里自己略显臃肿的侧脸,突然有点庆幸此刻的克制。
十一点整,实验室楼下的公告栏前。
季昭星刚走到梧桐树下,就看见仲月清站在海报旁。他穿了件浅灰色西装,领带系得一丝不苟,平日里微乱的短发梳得整整齐齐,阳光穿过发丝在颈间投下细碎的光斑。
“等很久了吗?”季昭星的指尖绞着裙摆,突然觉得空腹带来的眩晕感更明显了。
“刚到。”他的目光落在她耳尖的星星耳环上,声音比平时低了些,“很好看。”
“走吧。”他快步往礼堂方向走。季昭星看着他挺拔的背影,突然觉得空腹的眩晕感里,掺了点甜。
礼堂的水晶灯在正午十两点准时亮起,把舞池照得像铺满碎钻的湖面。
“紧张?”他把一杯果汁塞到她手里。
季昭星摇摇头。
第一支舞曲响起时,仲月清的手轻轻落在她的腰侧。他的掌心干燥而温暖,隔着薄薄的裙料,能感受到他指尖的微颤。两人的舞步磕磕绊绊,他总在转身时差点踩到她的裙摆,她则频频撞到他的胸口。
“没事吧?”他的声音贴着发顶传来,带着不易察觉的慌张。
季昭星摇摇头,却在抬头时看见他的眼睛。那里映着水晶灯的光,像落了整片银河,而银河的中央,清晰地倒映着她的脸。舞池边缘的地毯上,两串脚印慢慢靠近、重叠,像两条终于找到交点的曲线。
中场休息时,林薇举着相机跑过来:“快快快,拍张合照!”
季昭星往仲月清身边靠了靠,肩膀不小心碰到他的臂弯。他没有躲开,只是悄悄调整了站姿,让她能更稳地倚着。快门按下的瞬间,她看见他对着镜头微微扬了扬嘴角,像代码通过编译时跳出来的成功提示。
下午三点,舞曲渐歇。
林薇拉着男友去吃下午茶,周明宇抱着奖杯往实验室跑——他在趣味编程比赛里拿了奖。季昭星站在礼堂门口,看着仲月清把西装外套搭在臂弯里,突然说:“去实验室吗?”
他转过头,夕阳正落在他的侧脸,把睫毛的影子拉得很长。“现在?”
“嗯。”季昭星点头时,裙摆扫过他的鞋尖,“之前说的‘偏见惩罚项’,我突然想到个新参数。”
“把上周的女性用户语音样本调出来,第 37 组到第 52 组。”
季昭星在自己的工位坐下,开机时屏幕反光里,她看见自己的脸 —— 眼睛亮得吓人,嘴角还带着没褪的笑意。她点开语音文件夹,鼠标悬停在属性栏上:采样地点大多标注着 “一线城市写字楼”,年龄集中在 25-35 岁。
“师兄,你的训练数据是不是主要来自……”
“优质用户群体。” 仲月清打断她,笔尖在 “损失函数” 四个字上重重一顿,“算法需要在标准化环境下训练,嘈杂数据会干扰收敛。”
季昭星没说话,只是点开了第 41 组样本。音频里的女生声音很轻,带着哭腔说 “我没有生气”,模型识别结果却赫然标着 “愤怒,置信度 91%”。她放大频谱图,指腹无意识地蹭过屏幕上那段波动:“你看这里,她的语调在‘气’字尾音有个 0.3 秒的下沉,这是‘委屈’的典型特征,但你的模型把它归为‘愤怒’的高频段了。”
仲月清的笔尖顿在白板上。他走过来时,带起一阵淡淡的薄荷香,俯身看屏幕的动作让两人距离骤然拉近。他的呼吸扫过她的耳廓,季昭星的耳垂瞬间烧了起来,连带着声音都发飘:“这、这就是典型的特征误判……”
“反向传播算法在更新权重时,” 他的声音比平时低了些,像浸在温水里,“会自动强化高置信度的特征,比如女性‘愤怒’时的高频段 —— 这组数据里,这类样本的梯度下降速度确实更快。”
他说话时,肩膀偶尔会碰到她的胳膊,隔着两层薄薄的衣料,热度却烫得季昭星心跳如擂鼓。她盯着屏幕上跳动的波形,突然想起一句话“算法最像人的地方,是会把偏爱藏进每一次迭代里。”
“我们做个对比实验吧。” 她突然抬头,鼻尖差点撞上他的下巴,吓得往后缩了缩,“用相同的算法,分别训练一线城市白领和三四线城市女性的语音样本,看看权重更新路径是不是有差异。”
仲月清后退半步,镜片后的目光里闪过一丝惊讶,随即沉了下去:“你怀疑我的数据来源有问题?”
“我怀疑数据里藏着我们没看见的规律。” 季昭星调出自己的云盘,指尖在触摸板上微微发颤,“这是我本科做社会实践时收集的语音库,里面有菜市场阿姨的讨价还价,有乡镇教师的公开课录音……”
其实这是她重生前特意整理的资料,包含 12 个省份、2000 多个小时的多场景语音样本。前世她写报道时,曾用这些数据证明仲月清算法的偏见,如今却成了帮他拆弹的剪子。
仲月清盯着她的屏幕,沉默了足足半分钟。晨光在他脸上移动,把睫毛的影子投在眼下,像道浅浅的泪痕。就在季昭星以为他会拒绝时,他突然伸出手,掌心向上:“U 盘。”
实验进行到第三个小时,差异开始像潮水般涌出来。
当仲月清把两组反向传播的权重更新曲线投影在墙上时,两人 “呀” 了一声 —— 白领样本的曲线在 “高频愤怒” 区域陡峭如悬崖,而季昭星的样本曲线则平缓得多,在 “低频委屈” 区域有明显的凸起,像片温柔的坡地。
“这不可能。” 仲月清喃喃自语,手指在键盘上飞快敲击,指节泛白,“反向传播的数学逻辑是无偏的,怎么会……”
“数学无偏,但数据有偏啊。” 季昭星指着曲线拐点,声音轻得像叹息,“你的样本里,女性表达‘委屈’时,周围环境噪音普遍低于 40 分贝,而我的样本里有 63% 超过 60 分贝 —— 菜市场的喧嚣、教室里的粉笔声,这些背景音会改变语音特征的权重分配。”
她顿了顿,调出一段录音。音频里卖菜阿姨笑着说 “这价真不能再少了”,语气里的无奈被模型识别成了 “愉悦”。“你看,她的语气词拖得很长,在你的模型里,这被当成‘开心’的特征,但结合语境其实是‘妥协’。”
仲月清猛地攥紧了拳头,手背青筋跳了跳。季昭星知道他在想什么 —— 他一直坚信算法是面干净的镜子,却忘了镜子早被他自己的偏见镀了层灰。
“这就是你说的‘反向传播里的偏见’?” 仲月清突然开口,声音有些发颤,“就像我们训练模型时,总不自觉地让它更像‘我们认为的样子’?”
实验室里陷入沉默。季昭星的目光落在仲月清的电脑壁纸 —— 那是他母亲的照片,心理学教授站在阳光下笑,发梢沾着金箔似的光。她记得前世自己发现这张壁纸时,仲月清像被踩了尾巴的猫似的合上电脑,吼了句 “别碰我东西”。
“其实有个办法。” 她轻声说,“在损失函数里加入‘偏见惩罚项’,当模型对某类群体的识别误差超过阈值时,自动降低该特征的权重更新速度。”
仲月清的手指悬在回车键上,没按下去。季昭星看见他喉结动了动,屏幕蓝光映在他脸上,像层薄冰。她知道他在挣扎 —— 这意味着要推翻他之前的心血,甚至可能让好不容易提升到 91.5% 的准确率再次下降。
“试试吧。” 她走到他身边,距离近得能闻到他发间的洗发水味,“你妈妈是心理学教授,她肯定知道,真正的理解,是先承认自己可能错了。”
这句话像根细针,轻轻刺破了什么。仲月清深吸一口气,按下了回车键。
新的权重曲线出现在屏幕上时,季昭星的心跳漏了一拍。那条曲线不再陡峭如悬崖,而是像条蜿蜒的河,在不同特征区域找到了温柔的平衡。第 41 组样本的识别结果跳出来 ——“委屈,置信度 95%”。
“今晚加个班?” 他突然说,声音里带着点不易察觉的沙哑,“把‘偏见惩罚项’的参数再调调。”
窗外的夕阳正慢慢沉下去,把实验室染成蜂蜜似的橘色。季昭星看着他转身时带起的衣角,突然想起烧烤摊那串没吃完的烤翅。原来有些偏见就像烤焦的外壳,只要愿意敲碎,里面藏着的,或许是意料之外的温柔。
她用力点头:“好。”
服务器的嗡鸣声似乎都轻快了些。季昭星低头调试参数时,感觉仲月清往她桌上放了份三明治和一瓶热牛奶,瓶身还带着他手心的温度。她没抬头,只是指尖在键盘上敲出个小小的笑脸符号,藏进了代码注释里。
窗外的晚霞染红了半边天,季昭星咬着三明治,空腹的眩晕感早就消失了,取而代之的是一种暖暖的饱腹感,从胃里一直漫到心底。她突然明白,有些偏见就像没调试好的代码,只要愿意一起修正,总能找到温柔的解法。
梦远书城已将原网页转码以便移动设备浏览
本站仅提供资源搜索服务,不存放任何实质内容。如有侵权内容请联系搜狗,源资源删除后本站的链接将自动失效。
推荐阅读