2022-12-12
计算机网络的新黄金时代

感谢许辰人教授、黄群教授邀请,非常荣幸于 2022 年 12 月 12 日为北京大学计算机网络课程做了一个 guest lecture。

Abstract: 数据中心网络、广域网和无线网络为万物互联的智能世界提供了通信基石。

数据中心网络传统上为容易并行的 Web 服务设计。但如今 AI、大数据、HPC 都是大规模异构并行计算系统,对通信性能都提出了很高的要求,厚重的软件栈造成巨大的开销,这就要求数据中心网络的通信语义从字节流演进到包括消息语义、同步和异步远端内存访问、RPC 在内的内存语义,软硬结合实现极致的时延和带宽。未来,我们期望把数据中心作为一台计算机,一方面实现异构计算、存储设备间的对等直通,让数据中心互联像主机内部总线一样高性能;另一方面通过 Serverless 让分布式系统编程像单机编程一样便捷。

大规模直播和短视频点播、实时音视频通信等应用对广域网传输的稳定性提出了新挑战。互联网巨头纷纷自建全球加速网络,并设计 QUIC 等新型传输协议,实现优质用户体验。此外,由于我国西部能源成本低,东数西算成为国家战略,通过 Regionless 调度,实现 “全国一体化大数据中心”。

手机、PC、穿戴设备、智能家居、智能车等智能终端的无缝协同、5G to B 等工业互联网应用都需要稳定的低时延和高带宽,这需要无线协议栈优化,甚至无线内存语义以支持 Gbps 级别的带宽。此外,通过鸿蒙的 “分布式超级终端” 编程框架,可以使能更紧密的分布式协同,实现数据和服务无缝流转。

Download Slides PDF (2022-12-15 更新)

Download Slides PPTX (2022-12-15 更新)

演讲全文:

Read More

2022-12-10
ChatGPT 初体验

最近几天大家都在玩 ChatGPT,真的非常厉害,虽然不是万能的,但是这是第一个让我感受到不像人工智障的 AI 对话系统,对指代、记忆上下文等难题处理得也非常好。尤其是在编程问题方面,有时候比 StackOverflow 还好用。如果我的候选人表现成这样,我肯定会优先录用的。

目前 ChatGPT 主要的缺点是:

  1. 知识库更新不足、覆盖度不够全,不能回答最近发生的事件,不能回答比较偏门的知识。建议与搜索引擎或者知识图谱相结合,先用 prompt 词搜索出一些结果,然后再用 NLP 的方法把搜索结果整合起来。据说有一些研究团队已经在这个方向上努力了。
  2. 逻辑推理能力不足,稍微复杂一点的逻辑就很容易搞错,而且搞错了还回答得一本正经。如何解决任意复杂的逻辑问题是一个很大的挑战。能识别看上去正确但实质上荒谬的回答就更难了。
  3. 目前还只支持文本,不支持多模态。目前已经可以让 ChatGPT 生成 prompt,再输入到 DALL-E 里面生成图片。未来,支持多模态输入和多模态输出的生成模型将使人机交互更自然,可能成为下一代的人机交互范式。
  4. 单次回答的成本目前较高,需要数美分,显著高于一次 Google 搜索的成本。如果能通过算法或硬件的改进降低成本,或者与推荐、广告相结合产生新的商业模式,就能够有商业盈利的空间。

今年可以说是 AI 生成内容的 “元年” 了。前几个月我们都被 CV 领域的 stable diffusion(DALL-E 2)震撼了,现在 ChatGPT 又为 NLP 设立了新的 SOTA。Stable diffusion 和 ChatGPT 恰好都是 OpenAI 做的,OpenAI 的背后金主是微软,这也算是微软在 AI 领域扳回的重要一局了。前些年,一直是 Google Deepmind 的 Alpha 系列在抢风头,从下围棋到蛋白质、矩阵计算。

能跟人自然交流的智能助理是无数科幻电影中的场景,也是各大公司 20 年前就设立的 vision,今天终于看到了变成现实的曙光。智能助理可能孕育出下一个万亿美金级别的产业,就像移动互联网颠覆 PC 互联网、视频颠覆文字一样,成为新的人机交互范式,深刻改变人类的工作和生活。

以下是我在 ChatGPT 中尝试的一些例子:

Read More

2022-12-10
是什么在阻碍国内团队研究 ChatGPT 这样的产品?

首先,是业务规模。由于地缘和文化的原因,大多数国内公司在出海上面都遇到一些困难,主要是国内市场,比欧美市场相对来说就小很多。同样是公有云,欧美市场 AWS、Azure、Google Cloud 就比国内阿里、腾讯、华为云的营收和市值高。由于开发成本基本上是可以平摊的,美国公司开发人员的人均薪酬就比国内的高,可以雇佣相对来说更优秀的人才;也可以产出更多的利润来支撑相对远期的研究,例如 OpenAI、Deepmind 和 Microsoft Research。ChatGPT 这样的突破性创新很难来自开发节奏紧张的产品部门,一般是来自没有太多短期商业变现压力的研究部门

Read More

2022-09-03
领证照片 @北京市丰台区民政局

文字内容待补充,先放出来几张照片吧~

戳此看领证照片

Read More

2022-07-27
计算机网络与协议实验室 & 分布式与并行软件实验室业务简介

计算机网络与协议实验室

华为计算机网络与协议实验室是 2012 实验室中央软件院分布式与并行软件实验室的下属部门,位置分布在北京、上海、杭州、深圳、以色列特拉维夫。

愿景:扎根筑基石,创新引领分布式通信未来

定位:华为公司在计算机网络与协议技术领域的软件发动机,涵盖理论突破、技术发明、技术创新和精品交付。站在本技术领域最前沿,研究并突破计算原生网络、广域网准确定性通信世界级技术难题,打造业界领先的分布式通信全栈,协同ICT、终端、云、智能车等主力产品团队共同构筑差异化通信竞争力,逐步壮大产业生态,助力商业成功。

团队:由业界顶尖领军专家、天才少年、博士和工程师混编特战队、海外军团共同组成的高水平创新团队。技术研究成果显著,2018年至今,已有5篇论文被全球网络通信顶级会议SIGCOMM录用;并连续3届都有关键技术入选华为公司10大发明。

Read More

2022-07-22
10 年来,我走过的城市(持续更新中)

就在这里更新和预告我(将)走过的城市吧!

2023

开始日期 结束日期 城市
2023-05-28 2023-05-28 北京
2023-05-27 2023-05-28 西安
2023-05-25 2023-05-27 杭州
2023-05-23 2023-05-25 深圳
2023-05-21 2023-05-23 上海
2023-05-21 2023-05-21 杭州
2023-05-20 2023-05-21 石家庄
2023-05-14 2023-05-20 北京
2023-05-13 2023-05-14 乌鲁木齐
2023-05-13 2023-05-13 精河
2023-05-12 2023-05-12 库尔德宁
2023-05-11 2023-05-12 那拉提
2023-05-10 2023-05-11 伊宁
2023-05-10 2023-05-10 赛里木湖
2023-05-09 2023-05-10 克拉玛依
2023-05-09 2023-05-09 魔鬼城
2023-05-08 2023-05-09 禾木
2023-05-07 2023-05-08 喀纳斯
2023-05-06 2023-05-07 布尔津
2023-05-06 2023-05-06 五彩滩
2023-05-06 2023-05-06 乌伦古湖
2023-05-05 2023-05-06 乌鲁木齐
2023-05-05 2023-05-05 天山天池
2023-05-04 2023-05-05 乌鲁木齐
2023-05-03 2023-05-04 太原
2023-05-02 2023-05-03 古交
2023-04-29 2023-05-02 石家庄
2023-04-16 2023-04-29 北京
2023-04-14 2023-04-16 石家庄
2023-04-12 2023-04-14 杭州
2023-04-09 2023-04-12 北京
2023-04-07 2023-04-09 长沙
2023-03-01 2023-04-07 北京
2023-02-27 2023-03-01 南京
2023-02-19 2023-02-27 深圳
2023-02-11 2023-02-19 北京
2023-02-08 2023-02-11 深圳
2023-02-03 2023-02-08 北京
2023-01-28 2023-02-03 杭州
2023-01-27 2023-01-28 北京
2023-01-23 2023-01-27 石家庄
2023-01-22 2023-01-23 太原
2023-01-21 2023-01-22 古交
2023-01-20 2023-01-21 太原
2023-01-02 2023-01-20 北京
2023-01-01 2023-01-02 天津

2022

开始日期 结束日期 城市
2022-12-31 2022-12-31 天津
2022-11-19 2022-12-31 北京
2022-11-16 2022-11-19 上海
2022-11-12 2022-11-16 杭州
2022-11-10 2022-11-12 北京
2022-11-08 2022-11-10 成都
2022-10-29 2022-11-08 北京
2022-10-23 2022-10-29 杭州
2022-10-22 2022-10-23 舟山
2022-10-21 2022-10-22 杭州
2022-10-19 2022-10-21 深圳
2022-10-01 2022-10-19 北京
2022-09-24 2022-10-01 杭州
2022-08-12 2022-09-24 北京
2022-08-10 2022-08-12 杭州
2022-08-03 2022-08-10 北京
2022-07-29 2022-08-03 杭州
2022-07-16 2022-07-29 北京
2022-07-13 2022-07-16 成都
2022-03-06 2022-07-13 北京
2022-03-04 2022-03-06 合肥
2022-02-27 2022-03-04 杭州
2022-02-27 2022-02-27 德清
2022-02-22 2022-02-27 杭州
2022-02-12 2022-02-22 北京
2022-01-27 2022-02-12 石家庄
2022-01-21 2022-01-27 杭州
2022-01-16 2022-01-21 上海
2022-01-10 2022-01-16 杭州
2022-01-03 2022-01-10 北京
2022-01-01 2022-01-03 苏州
2022-01-01 2022-01-01 北京
Read More

2022-06-27
从 LUG GitLab 迁移了 100+ 个仓库到 GitHub

USTC LUG GitLab 即将停止对校外用户服务,虽然我是校内邮箱,但是为了预防哪天突然被拔网线,把我的所有仓库都备份到本地了,并把公开仓库挂到了 GitHub 上。作为 LUG GitLab 的第一个用户,我一共有 209 个仓库,其中个人仓库 123 个。LUG GitLab 从 2013 年 3 月 14 日(Pi Day)创立,至今已经运行 9 年,创立时间甚至比 Telegram 还稍微早几个月。GitLab 和 VPN 是我创立的运行至今的年头最长(9 年)的网络服务,服务的用户数以千计,目前我都早已离开管理和运维团队,但对这些服务还是有很多感情的。

我的 GitHub 主页:https://github.com/bojieli

我的 USTC LUG GitLab 主页:https://git.lug.ustc.edu.cn/boj

这些公开的仓库主要是我在科大做的课程作业、本科的各种项目、在 LUG 做的网络服务。在 MSRA 读博期间做的大部分项目都没有开源,我只把 SocksDirect 的源码放出来了,还放出来了几篇 paper 的 LaTeX 源码,其中一些做了脱敏处理,没有保留内部 commit 信息。工作之后的源码就更不可能随意公开了,已经开源的 MindSpore AKG 项目也是在开源时对内网 commit 信息做了脱敏处理的(开源之后的内部贡献者就是直接在公开 repo 上开发了,但开源之后我已经离开 AKG 项目)。

因此,从 GitHub 的 contributions(贡献统计)可以看到,最多的一年是 2016 年,有 2000+ contributions;去年和前年都只有少得可怜的 contributions;2013-2015 年都有 1000+ contributions;2017-2019 年就只有几百了,一是由于项目没有开源,二是由于我个人也比较脱离写代码的一线,整天琢磨新的 research idea,变成了 PPT 工程师,在实际写代码实现 idea 上花的时间并不多,这也是我博士后期发 paper 比较少的原因。

Read More

2022-06-01
羚羊木雕(张之路)

“那只羚羊哪儿去啦?”妈妈突然问我。

妈妈说的羚羊是一件用黑色硬木雕成的工艺品。那是爸爸从非洲带回来给我的。它一直放在我桌子角上。这会儿,我的心怦怦地跳了起来,因为昨天我把它送给了我的好朋友万芳。

Read More

2022-05-14
中科大盛世中华舞蹈表演,古风变鬼畜

舞蹈表演上,《花月成双》第一次跳到一半卡住了,重跳,结果又卡住两次……成为全场给观众带来欢乐更多的节目 :)

小视频(223 MB,2:23)

如果播放卡顿的话,可以移步 B站链接

Read More

2022-05-08
工业界中的系统研究——ACM ChinaSys Colloquium系列学术讲座第一期线上活动成功举办

(本文转载自 CNSys 公众号,欢迎关注 ACM ChinaSys 的官方公众号 CNSys)

ACM ChinaSys Colloquium 于2022年4月29日举办第一期线上学术讲座,以“工业界中的系统研究”为主旨进行了学术讨论交流。阿里巴巴副总裁、阿里云智能数据库产品事业部负责人李飞飞博士、华为中央软件院分布式与并行软件实验室主任谭焜博士作为特邀嘉宾,做学术报告并参加在线访谈。中国科学技术大学李诚特任研究员、华为李博杰博士、华为姚婷博士主持学术讲座。会议以腾讯在线会议室和B站直播的方式进行,共吸引600余人次观看。

Read More
RSS