Bojie Li (李博杰)
2022-12-12
感谢许辰人教授、黄群教授邀请,非常荣幸于 2022 年 12 月 12 日为北京大学计算机网络课程做了一个 guest lecture。
Abstract: 数据中心网络、广域网和无线网络为万物互联的智能世界提供了通信基石。
数据中心网络传统上为容易并行的 Web 服务设计。但如今 AI、大数据、HPC 都是大规模异构并行计算系统,对通信性能都提出了很高的要求,厚重的软件栈造成巨大的开销,这就要求数据中心网络的通信语义从字节流演进到包括消息语义、同步和异步远端内存访问、RPC 在内的内存语义,软硬结合实现极致的时延和带宽。未来,我们期望把数据中心作为一台计算机,一方面实现异构计算、存储设备间的对等直通,让数据中心互联像主机内部总线一样高性能;另一方面通过 Serverless 让分布式系统编程像单机编程一样便捷。
大规模直播和短视频点播、实时音视频通信等应用对广域网传输的稳定性提出了新挑战。互联网巨头纷纷自建全球加速网络,并设计 QUIC 等新型传输协议,实现优质用户体验。此外,由于我国西部能源成本低,东数西算成为国家战略,通过 Regionless 调度,实现 “全国一体化大数据中心”。
手机、PC、穿戴设备、智能家居、智能车等智能终端的无缝协同、5G to B 等工业互联网应用都需要稳定的低时延和高带宽,这需要无线协议栈优化,甚至无线内存语义以支持 Gbps 级别的带宽。此外,通过鸿蒙的 “分布式超级终端” 编程框架,可以使能更紧密的分布式协同,实现数据和服务无缝流转。
Download Slides PDF (2022-12-15 更新)
Download Slides PPTX (2022-12-15 更新)
演讲全文:
- 第一篇:计算机网络的新黄金时代(一):数据中心
- 第二篇:计算机网络的新黄金时代(二):广域网
- 第三篇:计算机网络的新黄金时代(三):无线网络(待续)
2022-12-10
最近几天大家都在玩 ChatGPT,真的非常厉害,虽然不是万能的,但是这是第一个让我感受到不像人工智障的 AI 对话系统,对指代、记忆上下文等难题处理得也非常好。尤其是在编程问题方面,有时候比 StackOverflow 还好用。如果我的候选人表现成这样,我肯定会优先录用的。
目前 ChatGPT 主要的缺点是:
- 知识库更新不足、覆盖度不够全,不能回答最近发生的事件,不能回答比较偏门的知识。建议与搜索引擎或者知识图谱相结合,先用 prompt 词搜索出一些结果,然后再用 NLP 的方法把搜索结果整合起来。据说有一些研究团队已经在这个方向上努力了。
- 逻辑推理能力不足,稍微复杂一点的逻辑就很容易搞错,而且搞错了还回答得一本正经。如何解决任意复杂的逻辑问题是一个很大的挑战。能识别看上去正确但实质上荒谬的回答就更难了。
- 目前还只支持文本,不支持多模态。目前已经可以让 ChatGPT 生成 prompt,再输入到 DALL-E 里面生成图片。未来,支持多模态输入和多模态输出的生成模型将使人机交互更自然,可能成为下一代的人机交互范式。
- 单次回答的成本目前较高,需要数美分,显著高于一次 Google 搜索的成本。如果能通过算法或硬件的改进降低成本,或者与推荐、广告相结合产生新的商业模式,就能够有商业盈利的空间。
今年可以说是 AI 生成内容的 “元年” 了。前几个月我们都被 CV 领域的 stable diffusion(DALL-E 2)震撼了,现在 ChatGPT 又为 NLP 设立了新的 SOTA。Stable diffusion 和 ChatGPT 恰好都是 OpenAI 做的,OpenAI 的背后金主是微软,这也算是微软在 AI 领域扳回的重要一局了。前些年,一直是 Google Deepmind 的 Alpha 系列在抢风头,从下围棋到蛋白质、矩阵计算。
能跟人自然交流的智能助理是无数科幻电影中的场景,也是各大公司 20 年前就设立的 vision,今天终于看到了变成现实的曙光。智能助理可能孕育出下一个万亿美金级别的产业,就像移动互联网颠覆 PC 互联网、视频颠覆文字一样,成为新的人机交互范式,深刻改变人类的工作和生活。
以下是我在 ChatGPT 中尝试的一些例子:
2022-12-10
首先,是业务规模。由于地缘和文化的原因,大多数国内公司在出海上面都遇到一些困难,主要是国内市场,比欧美市场相对来说就小很多。同样是公有云,欧美市场 AWS、Azure、Google Cloud 就比国内阿里、腾讯、华为云的营收和市值高。由于开发成本基本上是可以平摊的,美国公司开发人员的人均薪酬就比国内的高,可以雇佣相对来说更优秀的人才;也可以产出更多的利润来支撑相对远期的研究,例如 OpenAI、Deepmind 和 Microsoft Research。ChatGPT 这样的突破性创新很难来自开发节奏紧张的产品部门,一般是来自没有太多短期商业变现压力的研究部门。
2022-09-03
2022-07-27
计算机网络与协议实验室
华为计算机网络与协议实验室是 2012 实验室中央软件院分布式与并行软件实验室的下属部门,位置分布在北京、上海、杭州、深圳、以色列特拉维夫。
愿景:扎根筑基石,创新引领分布式通信未来
定位:华为公司在计算机网络与协议技术领域的软件发动机,涵盖理论突破、技术发明、技术创新和精品交付。站在本技术领域最前沿,研究并突破计算原生网络、广域网准确定性通信世界级技术难题,打造业界领先的分布式通信全栈,协同ICT、终端、云、智能车等主力产品团队共同构筑差异化通信竞争力,逐步壮大产业生态,助力商业成功。
团队:由业界顶尖领军专家、天才少年、博士和工程师混编特战队、海外军团共同组成的高水平创新团队。技术研究成果显著,2018年至今,已有5篇论文被全球网络通信顶级会议SIGCOMM录用;并连续3届都有关键技术入选华为公司10大发明。
2022-07-22
就在这里更新和预告我(将)走过的城市吧!
2023
开始日期 | 结束日期 | 城市 |
---|---|---|
2023-05-28 | 2023-05-28 | 北京 |
2023-05-27 | 2023-05-28 | 西安 |
2023-05-25 | 2023-05-27 | 杭州 |
2023-05-23 | 2023-05-25 | 深圳 |
2023-05-21 | 2023-05-23 | 上海 |
2023-05-21 | 2023-05-21 | 杭州 |
2023-05-20 | 2023-05-21 | 石家庄 |
2023-05-14 | 2023-05-20 | 北京 |
2023-05-13 | 2023-05-14 | 乌鲁木齐 |
2023-05-13 | 2023-05-13 | 精河 |
2023-05-12 | 2023-05-12 | 库尔德宁 |
2023-05-11 | 2023-05-12 | 那拉提 |
2023-05-10 | 2023-05-11 | 伊宁 |
2023-05-10 | 2023-05-10 | 赛里木湖 |
2023-05-09 | 2023-05-10 | 克拉玛依 |
2023-05-09 | 2023-05-09 | 魔鬼城 |
2023-05-08 | 2023-05-09 | 禾木 |
2023-05-07 | 2023-05-08 | 喀纳斯 |
2023-05-06 | 2023-05-07 | 布尔津 |
2023-05-06 | 2023-05-06 | 五彩滩 |
2023-05-06 | 2023-05-06 | 乌伦古湖 |
2023-05-05 | 2023-05-06 | 乌鲁木齐 |
2023-05-05 | 2023-05-05 | 天山天池 |
2023-05-04 | 2023-05-05 | 乌鲁木齐 |
2023-05-03 | 2023-05-04 | 太原 |
2023-05-02 | 2023-05-03 | 古交 |
2023-04-29 | 2023-05-02 | 石家庄 |
2023-04-16 | 2023-04-29 | 北京 |
2023-04-14 | 2023-04-16 | 石家庄 |
2023-04-12 | 2023-04-14 | 杭州 |
2023-04-09 | 2023-04-12 | 北京 |
2023-04-07 | 2023-04-09 | 长沙 |
2023-03-01 | 2023-04-07 | 北京 |
2023-02-27 | 2023-03-01 | 南京 |
2023-02-19 | 2023-02-27 | 深圳 |
2023-02-11 | 2023-02-19 | 北京 |
2023-02-08 | 2023-02-11 | 深圳 |
2023-02-03 | 2023-02-08 | 北京 |
2023-01-28 | 2023-02-03 | 杭州 |
2023-01-27 | 2023-01-28 | 北京 |
2023-01-23 | 2023-01-27 | 石家庄 |
2023-01-22 | 2023-01-23 | 太原 |
2023-01-21 | 2023-01-22 | 古交 |
2023-01-20 | 2023-01-21 | 太原 |
2023-01-02 | 2023-01-20 | 北京 |
2023-01-01 | 2023-01-02 | 天津 |
2022
开始日期 | 结束日期 | 城市 |
---|---|---|
2022-12-31 | 2022-12-31 | 天津 |
2022-11-19 | 2022-12-31 | 北京 |
2022-11-16 | 2022-11-19 | 上海 |
2022-11-12 | 2022-11-16 | 杭州 |
2022-11-10 | 2022-11-12 | 北京 |
2022-11-08 | 2022-11-10 | 成都 |
2022-10-29 | 2022-11-08 | 北京 |
2022-10-23 | 2022-10-29 | 杭州 |
2022-10-22 | 2022-10-23 | 舟山 |
2022-10-21 | 2022-10-22 | 杭州 |
2022-10-19 | 2022-10-21 | 深圳 |
2022-10-01 | 2022-10-19 | 北京 |
2022-09-24 | 2022-10-01 | 杭州 |
2022-08-12 | 2022-09-24 | 北京 |
2022-08-10 | 2022-08-12 | 杭州 |
2022-08-03 | 2022-08-10 | 北京 |
2022-07-29 | 2022-08-03 | 杭州 |
2022-07-16 | 2022-07-29 | 北京 |
2022-07-13 | 2022-07-16 | 成都 |
2022-03-06 | 2022-07-13 | 北京 |
2022-03-04 | 2022-03-06 | 合肥 |
2022-02-27 | 2022-03-04 | 杭州 |
2022-02-27 | 2022-02-27 | 德清 |
2022-02-22 | 2022-02-27 | 杭州 |
2022-02-12 | 2022-02-22 | 北京 |
2022-01-27 | 2022-02-12 | 石家庄 |
2022-01-21 | 2022-01-27 | 杭州 |
2022-01-16 | 2022-01-21 | 上海 |
2022-01-10 | 2022-01-16 | 杭州 |
2022-01-03 | 2022-01-10 | 北京 |
2022-01-01 | 2022-01-03 | 苏州 |
2022-01-01 | 2022-01-01 | 北京 |
2022-06-27
USTC LUG GitLab 即将停止对校外用户服务,虽然我是校内邮箱,但是为了预防哪天突然被拔网线,把我的所有仓库都备份到本地了,并把公开仓库挂到了 GitHub 上。作为 LUG GitLab 的第一个用户,我一共有 209 个仓库,其中个人仓库 123 个。LUG GitLab 从 2013 年 3 月 14 日(Pi Day)创立,至今已经运行 9 年,创立时间甚至比 Telegram 还稍微早几个月。GitLab 和 VPN 是我创立的运行至今的年头最长(9 年)的网络服务,服务的用户数以千计,目前我都早已离开管理和运维团队,但对这些服务还是有很多感情的。
我的 GitHub 主页:https://github.com/bojieli
我的 USTC LUG GitLab 主页:https://git.lug.ustc.edu.cn/boj
这些公开的仓库主要是我在科大做的课程作业、本科的各种项目、在 LUG 做的网络服务。在 MSRA 读博期间做的大部分项目都没有开源,我只把 SocksDirect 的源码放出来了,还放出来了几篇 paper 的 LaTeX 源码,其中一些做了脱敏处理,没有保留内部 commit 信息。工作之后的源码就更不可能随意公开了,已经开源的 MindSpore AKG 项目也是在开源时对内网 commit 信息做了脱敏处理的(开源之后的内部贡献者就是直接在公开 repo 上开发了,但开源之后我已经离开 AKG 项目)。
因此,从 GitHub 的 contributions(贡献统计)可以看到,最多的一年是 2016 年,有 2000+ contributions;去年和前年都只有少得可怜的 contributions;2013-2015 年都有 1000+ contributions;2017-2019 年就只有几百了,一是由于项目没有开源,二是由于我个人也比较脱离写代码的一线,整天琢磨新的 research idea,变成了 PPT 工程师,在实际写代码实现 idea 上花的时间并不多,这也是我博士后期发 paper 比较少的原因。
2022-06-01
“那只羚羊哪儿去啦?”妈妈突然问我。
妈妈说的羚羊是一件用黑色硬木雕成的工艺品。那是爸爸从非洲带回来给我的。它一直放在我桌子角上。这会儿,我的心怦怦地跳了起来,因为昨天我把它送给了我的好朋友万芳。