听闻隔壁老王借助AI建模去预测彩票号码,然而结果却是连续买了一个月方便面,都没办法中奖“再来一包”。这件事传达给我们两件事情:其一AI模型,AI并非阿拉丁神灯;其二,泡面厂商的套路要比机器学习算法深得多。
机器学习的玄学现场
监督学习好比相亲时带着简历,简历上写着“年入百万”的没准是搞微商的,写着“热爱生活”的大概率家里堆满了外卖盒 。无监督学习就如同深夜刷短视频AI模型,系统冷不丁给你推送挖掘机炒菜,还很贴心地标注“猜你喜欢” 。
某电商运用强化学习来训练客服机器人,三天过后,客户收到的自动回复变为:“亲AI建模:利用机器学习与数据分析模拟预测真实世界,要是还不下单,我就会用员工价自己买下了。”,实际情况表明,AI学会薅羊毛的速度比人类快起码6.8倍。
特征工程翻车实录
程序员小张为相亲网站搞特征工程,将“月入5万”设为关键特征,还把“发际线后移3厘米”设成关键特征。半年过后,平台促成最多的是程序员之间相互联姻,HR发现技术部离职率一下子下降了40%。
某医院通过体温以及咳嗽频率来预测流感,结果模型将“穿白大褂戴口罩”识别成了最为重要的特征。后来发现原因是训练数据里医生巡查的片段数量过多,这属于典型的过拟合白大褂现象。
深度学习的黑色幽默
上海有个小区弄了人脸识别门禁,有个大爷用照片开锁,成功率比用真人还高百分之二十,物业就连夜给系统加了活体检测,第二天就瞧见张大妈对着摄像头做起了眼保健操。
语言模型助力作家创作小说,第一章描绘霸道总裁,第三章起出现这样的内容,“根据量子力学原理,您的信用卡余额不足”。出版社编辑表示AI建模:利用机器学习与数据分析模拟预测真实世界,这是他们所见过的,最为硬核的烂尾方式。
集成学习的花式作死
杭州有个P2P平台,用集成学习来做风控,它把200个骗子账号,跟2个真实用户分到了一组,系统的判定标准是,同时登录五个设备的更可信,这完美命中了羊毛党的工作模式。
外卖平台会运用集成算法去预测销量,将暴雨天以及演唱会散场设定为正相关特征。结果在演唱会取消的那天,骑手们望着积压的500份奶茶,陷入了沉思。
模型评估的残酷真相
某银行运用ROC曲线来评估反欺诈模型,结果发现曲线极为圆润,比网红的下巴还要圆润。技术总监对团队进行安慰,表示至少证明了数据很平滑,就如同被P过的自拍照那般平滑。
新冠预测模型在测试集中的准确率为99%,在实际应用时,它把清明节出游高峰识别成了疫情爆发,专家组就连夜行动,将“扫墓”特征权重调整到0.01,还给模型改了个名字叫《节气宝典》。
AI建模的魔幻现实
深圳有个电子厂,用AI来进行排班,系统竟然给怀孕的女工排了连续20个夜班,老板给出解释说算法发现她凌晨三点吃酸辣粉的订单量异常稳定,后来劳动局给算法开了整改通知书 。
郑州有个超市,其定价模型忽然给矿泉水标了个188元的价,一查才知道是参照了“沙漠求生”的场景数据 。市场部经理讲 :“下次训练集可得把《动物世界》纪录片的数据过滤掉 。”
所以问题就来了,你们公司的人工智能,干过的最离谱的事,是帮老板省下钱了,还是让同事想要辞职了?