首页 >武侠修真 >高二分科，我选校花也选亿万身家 > 第396章我这有几千张GPU，你要吗？

第396章我这有几千张GPU，你要吗？（1 / 2）

举报本章错误( 无需登录 )

八月的西安，是能把人烤出油来的那种热。

不像锦城那种阴湿的蒸笼感，西安的毒日头是直接劈下来的，混著秦川平原上吹来的乾热风，把整座城市炙烤得像一块巨大的砖窑。

任少卿拎著一个鼓囊囊的黑色双肩包，从西安交大东门的公交站一路走进校园，衬衫后背湿透了大半，贴在脊梁骨上，黏糊糊的，难受得很。

他低著头，盯著脚下的花岗岩路面，脑子里反覆过今天宣讲的那三十二页ppt。

第七页的实验数据。

第七页，是整个报告的命门。

任少卿闭上眼睛，那张对比折线图像刻进脑子里一样挥不去。

他基於alex架构改进的卷积神经网络模型，用东拼西凑的四卡gpu伺服器跑出来的结果，在pascalvoc2012数据集上，目標检测精度比学界主流的dp模型高出了將近十一个百分点。

十一个百分点。

在他看来，这不是一个数字。

这是一次典范转移。

他二十七岁，中科大和微软亚洲研究院联合培养的博士生。

去年从合肥到了一趟北京，跟著导师的组看完了hton组在ilsvrc比赛上用alex把传统方法打得落花流水的完整论文。

他当时就坐在微软大厦十二层的组会室里，咖啡都顾不上喝，盯著屏幕上那个把所有传统方法甩开將近十个百分点的成绩，心里某个地方“咔噠”一声，被什么彻底撬开了。

那种感觉，他后来想了很久——大概类似於在一片乌压压的普通人里，突然认出了另一个同类。

然后他就扎进去了。

整整八个月，几乎把所有能腾出来的时间全部押进去。

（请记住找书就去101看书网，101.超全网站，观看最快的章节更新）

他在自己的研究方向里开了条岔路，拐进了当时连导师都半信半疑的深度学习丛林，靠著微软亚研院借给他的一小块gpu算力，把那套模型一点一点搭起来，调参，再调参，处理过擬合，再处理，换框架，换数据增强方式……

然后跑出了那个让他失眠了整整一夜的数字。

但他没法训练更大的模型。

算力不够。

微软亚研院给他划的那块算力有上限，还要跟组里其他项目排队。

他算过了，如果要把网络规模再扩大一倍、数据集再丰富三倍，按现在能用的算力，连续不间断地跑，需要將近四十七天。

他等不起。

不是技术上等不起，是赛道上等不起。

他清楚地感觉到，全球跑在这个方向上的人越来越多。

去年alex一出，全世界顶级实验室就像被点著了一样，一股脑儿往这边涌。

斯坦福、u、deepd……这些机构手里握著的算力，是他这种人做梦都摸不到的规模。

他必须跑快一点。

所以他来了西安。

“2013年全国计算机视觉与模式识別暑期研討会”，主办方是西安交大和西工大，协办方拉了一长串，里头有两个国家级的超算中心。

这场会议在学界的分量不算最顶尖，但务实。

任少卿要的也不是顶尖，他要的是那两个超算中心的掛名负责人，以及他提前查过的、掛在西工大计算机视觉重点实验室名下的那一批国防科工委拨款的h系伺服器集群。

他的如意算盘是：论文宣讲好，跟西部这边的大拿们混个脸熟，饭桌上开口“化缘”，借一批算力用三个月。

道理上没问题。

学术圈就是这么运转的。

任少卿走进报告厅大楼，扑面而来一股凉气，把他半干不湿的衬衫一下子激透了，打了个哆嗦，稍微舒坦了点，抬头看了眼指示牌。

计算机视觉分会场，三楼报告厅b。

宣讲安排在下午两点，是下午场的第二个报告。

现在是上午十点四十分。

时间够。

……

上午的大会主题报告，任少卿坐在后排，把论文草稿掏出来又过了一遍。

台上是一位西工大的老先生，做人脸识別做了二十多年，满头白髮，声音洪亮，ppt是黑底绿字的经典配色，一页一页往下翻，每一页都有至少三段话。

老先生讲的是基於可形变模型的人脸特徵点对齐，理论体系扎实、推导完备，是这个领域里毫无疑问的泰斗级工作。

任少卿认认真真地听，认认真真地鼓掌。

然后继续低头看自己的论文。

……

下午两点整，任少卿走上讲台。

报告厅里坐了大概七八十人，前排是几位头髮花白的老教授，中间是一群年龄不一的副教授和研究员，后排是一大片跟他差不多大乃至更年轻的博士生和硕士生。

任少卿把u盘插进去，屏幕上亮出报告封面：

《基於改进卷积神经网络的目標检测：突破传统特徵工程的范式》

他扫了一眼台下，做了个深呼吸。

“各位老师、各位同学，下午好。我叫任少卿，来自中科大与微软亚洲研究院的联合培养项目。今天我要跟大家分享的工作，核心出发点是一个我认为非常重要的问题——传统的手工特徵，在目標检测任务上，是不是已经遇到了天花板”

后排有几个博士生坐直了一点。

前排的老先生们，表情没什么变化。

任少卿继续往下走。

他讲架构，讲他对alex的改进，讲数据增强，讲在pascalvoc上跑出来的结果。

讲得快，但逻辑清晰，每一步推进都有据可查。

讲到第七页，他把那张对比折线图放到了最大。

“……在相同的测试集上，我们的方法在ap指標上比当前最优的dp模型高出了11.3个百分点。这个差距，我认为不是调参层面的改进，而是底层特徵提取范式的本质性跃迁。”

报告厅里安静了大概两秒钟。

然后，前排左边第二个位置的老先生开口了。

任少卿认识这位老先生。

西安交大计算机视觉领域的老前辈，做了三十年图像处理，手底下出来的博士生如今遍布国內各大高校和研究院，標准的一代宗师。

“小伙子，”

老先生语气並不严厉，甚至带著点慈祥，

“你这个结果，训练的时候用了多少gpu”

“四张nvidiagtx780，训练了大约十二天。”

第396章 我这有几千张GPU，你要吗？（1 / 2）

第396章我这有几千张GPU，你要吗？（1 / 2）