X 关闭
“90后”陈宇恒赶上了刚刚好的年代—— 作为互联网时代的“原住民”,儿时记忆无关创业维艰而是互联网的神奇,少年时期以蓬勃的好奇心进行专业探索,青年时期有机会选择投身实践。如果从清华大学本科毕业时没有选择成为商汤科技的003号员工,他有可能就职于一家日本游戏公司或者赴美留学。在陈宇恒的记忆里,清华大学计算机系一届的本科毕业生有大概150人,填写自主创业的毕业生不超过五个。
(资料图片)
“从0到1”,是他编程中计算机处理器一次基本工作状态的切换,也是他毕业就创业时选择加入一家连名字都未起好的公司到香港上市成为“AI第一股”的经历,更是他从003号员工成长为200人的技术管理者过程中对人工智能在国内快速发展的见证。
过去的20年,互联网的普及成就了个人兴趣对天赋的激发,时代机遇也加持了他的职业生涯,正是这样无数个体的职业轨迹交汇而成历史前行的脉络。
从兴趣出发,毕业就创业
上小学的陈宇恒还不知道什么是第一次互联网泡沫破裂,但他记得在家里第一台386电脑上体验到一只小乌龟根据电脑上输入的指令自由移动带来“纯粹的、创造的快乐”。
等到他在大学里和对门宿舍的同学参加机器人足球世界杯时,他们依靠摄像头识别球门和足球的位置,控制1米多高的机器人完成射门,把“极客精神”提升到了新高度,“从最底层的一行代码到你构建出来用户可用的软件系统,全部没有实体,是纯粹人类思想智慧的产物” 。
2013年,陈宇恒从清华大学本科毕业。机器人大赛时的同组成员拉他入伙创业,初创公司的前三号员工就这样聚齐了,“公司刚好在清华门口租了个房,挺近的,懒得折腾”,就这样有些懵懂地开始毕业即创业,开始了计算机视觉和深度学习领域的探索。
“早上开会把沙发收起来,屋子就是会议室;晚上睡觉就把沙发拉出来,就是卧室。”这是包括商汤科技董事长兼CEO徐立在内的几位联创和早期员工的共同回忆。他们就像换了个大学宿舍,晚上代码写到两三点,早上十点、十一点才起床,为了开会还买了一台电视用来投屏。
八年后,徐立在上市致辞中这样调侃:“要说最初公司有什么特别吸引这群年轻人的地方,那可能就是从床到办公桌只需要7秒时间。凝聚大家的是心中那一团火,对原创技术的坚持,对改变世界的热望。”
也是在那里,他们见到了商汤科技的第一个投资人。“我们还在睡觉,接到电话说投资人要上来了,大家赶紧把被子、枕头塞到沙发床底下。”来者是IDG投资人牛奎光,陈宇恒觉得吸引投资人目光的倒不是那张蓝色的宜家沙发床,而是屋里的二次元壁纸,因为他说:“你们喜欢二次元的一般写代码好像都挺牛的”。
彼时,中国互联网+商业模式的造富浪潮开始。根据CVSource投中数据终端显示,就在商汤科技正式成立的2014年,互联网行业融资案例584个,其中披露金额的61.13亿美元,同比增长131.74%;互联网IPO15家,募集金额285.76亿美元,出现了2011年以来的一次高峰。
从兴趣出发,顺势而行、随心而动让陈宇恒在“大众创业 万众创新”之际站在了时代前沿。风口不是追的,是向前奔跑时,恰巧“好风凭借力”。
从小模型做到大装置,“要跟上时代的变化”
早期创业公司人手紧张是常态。陈宇恒的工作“包罗万象”:写代码、训练模型、从无到有地开发了商汤科技人脸SDK、互联网金融等对外产品的初始版本,完善并标准化公司内部开发者工具,发明数个智能视频领域专利技术,包括和销售一起去见客户。
让陈宇恒在工作中感到自豪的,是在2014年6月,商汤团队自主研发的DeepID系列人脸识别算法击败了Facebook同期发表的 DeepFace 算法, 这是全球首次超过人眼识别准确率的计算机视觉算法,也意味着突破了工业应用的红线。
但是,要把最先进的算法应用在真实的行业或者产品,陈宇恒们一度面临质疑和挑战。他还记得第一次把工程demo(模型)拿给一家知名手机厂商看,“人家看这个东西成本这么高,消耗的硬件资源这么大,很难做商业落地,也有很多困难。”
陈宇恒还记得,客户的第一次下单是在2015年,他和同事把算法和硬件的需求结合起来设计、协同优化,做了人证识别一体机。当年,即便在最先进的酒店里还主要依靠人力来完成身份的核实与查验,但现在人证识别一体机出现在越来越多的酒店前台,和公安联网进行人脸比对。陈宇恒和他的同事们打开了一块的全新市场。IDC数据显示,从2017年到2019年上半年,商汤在计算机视觉应用的市场份额一直稳居第一。
当AI芯片在2018年前后如雨后春笋般出现时,算法可以支持手机相册根据不同人的照片分门别类地存储,手机也开始专门配备可用于深度学习的NPU芯片用于图像处理。算力的可得性支持了算法的不断进步,陈宇恒和他的同事们看到了人工智能领域的更多机会。
“还是要做一些定义行业的事情。我们坚持原创,相信AI引领进步。” 陈宇恒觉得,一家有技术基因的公司在创业阶段更多是靠原创技术驱动,通过一些技术和产品的结合,商汤定义了早期一些行业的标准,创新了产品体验,“通过原创技术,做一些别人做不到的事情”。
2018年,科技部宣布依托商汤建设智能视觉国家新一代人工智能开放创新平台,商汤进一步加大了对算力基础设施建设的投入,这成为陈宇恒工作的转折点。最早纯做技术时可以单靠自己一个人写代码,但现在人工智能的系统构建更加复杂。
“人工智能小模型时代,深度学习解决的是一两个垂直领域的问题,垂直的任务并不需要非常大规模的中心化算力。我们也非常前瞻地看到,未来人工智能会进入到一个大模型的时代。”他对第一财经记者说。
陈宇恒的工作内容悄然从编程逐渐向技术管理转变,他不再仅是一个工号靠前的员工,还是有200多人团队的管理者,要以现有系统工程的理论、科学的现代化管理方法协同多位同事,完成世界领先的产品和技术目标。
他提到,“那时算力相对分散在全国各地,没有现在这么大规模,设备也没有现在这么新,直到2021年左右其实一直都是公司内部的一套基础设施,没有对外运营开放。”
2021年,在《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中,人工智能被6次提及,意味着人工智能在我国开启全面建设社会主义现代化国家新征程的宏伟蓝图中将发挥重要作用。次年,上海临港AIDC正式启用,商汤科技专门成立了事业群支撑整个人工智能基础设施的运营,陈宇恒要负责商业化的部分,肩上的任务更重了。
想要打造高密度的人才团队和营造创新性的工程文化氛围并不容易,他在看书和实践中慢慢有了些心得,“给到团队共同目标和愿景,并且有足够的context(语境),让他们一块努力,这样更能激发团队的主观能动性。现在环境发展越来越快,不确定性也越来越多,特别条条框框僵化的管理制度不合适未来的社会发展,需要建立柔性的价值观、使命、愿景驱动的组织。”
2022年,临港的算力规模已经达到了5000PFLPOS(1PFLPOS相当于每秒可以进行1千万亿次浮点运算),有效支持最多20个千亿参数量超大模型 (以千卡并行)同时训练。“现在都已经超过原先设计的算力容量了,我们把这些散落各处的算力放到一起,并且又增补了很多新增的人工智能算力。”大装置这样的新型AI基础设施需要数千块GPU的联合训练和推理,他要和团队一起系统化地思考怎么把网络的大规模算力高效互联,也要规划存储系统如何满足算力所需要的高吞吐。
“我们还是要跟上时代的变化”。陈宇恒带有一种使命感,他从万尼瓦尔•布什(Vannevar Bush)的《科学:无尽的前沿》中受到了强烈的启发:应用落地的本源是基础技术的进步,基础技术的进步来源于对长期主义的坚持。虽然业界有厂商公开喊出“所有产品都值得用大模型重做一遍”,也必然会由下一波造富浪潮的兴起,他还是更希望有人去关注那些坚持的人因为大装置的建设需要更多后来有志者的加入。
“人工智能也好,计算机也好发展是非常快的,要有持续的好奇心拥抱最新的技术变化。”陈宇恒说。
X 关闭
Copyright ? 2015-2018 版权所有 备案号:沪ICP备2022005074号-13
邮箱 : 58 55 97 3@qq.com