从此再无包下载的任何烦恼:看高手是如何参透 Go Module 的?
大家好,我是一只普通的煎鱼,周四晚上很有幸邀请到 goproxy.cn 的作者 @盛傲飞(@aofei) 到 Go 夜读给我们进行第 61 期 《Go Modules、Go Module Proxy 和 goproxy.cn》的技术分享。
本次 @盛傲飞 的夜读分享,是对 Go Modules 的一次很好的解读,比较贴近工程实践,我必然希望把这块的知识更多的分享给大家,因此有了今天本篇文章,同时大家也可以多关注 Go 夜读,每周会通过 zoom 在线直播的方式分享 Go 相关的技术话题,希望对大家有所帮助。
注:本文比较长,建议预留好时间。
前言
Go 1.11 推出的模块(Modules)为 Go 语言开发者打开了一扇新的大门,理想化的依赖管理解决方案使得 Go 语言朝着计算机编程史上的第一个依赖乌托邦(Deptopia)迈进。随着模块一起推出的还有模块代理协议(Module proxy protocol),通过这个协议我们可以实现 Go 模块代理(Go module proxy),也就是依赖镜像。
Go 1.13 的发布为模块带来了大量的改进,所以模块的扶正就是这次 Go 1.13 发布中开发者能直接感觉到的最大变化。而问题在于,Go 1.13 中的 GOPROXY 环境变量拥有了一个在中国大陆无法访问到的默认值 proxy.golang.org
,经过大家在 golang/go#31755 中激烈的讨论(有些人甚至将话提上升到了“自由世界”的层次),最终 Go 核心团队仍然无法为中国开发者提供一个可在中国大陆访问的官方模块代理。
为了今后中国的 Go 语言开发者能更好地进行开发,七牛云推出了非营利性项目 goproxy.cn
,其目标是为中国和世界上其他地方的 Gopher 们提供一个免费的、可靠的、持续在线的且经过 CDN 加速的模块代理。可以预见未来是属于模块化的,所以 Go 语言开发者能越早切入模块就能越早进入未来。
如果说 Go 1.11 和 Go 1.12 时由于模块的不完善你不愿意切入,那么 Go 1.13 你则可以大胆地开始放心使用。本次分享将讨论如何使用模块和模块代理,以及在它们的使用中会常遇见的坑,还会讲解如何快速搭建自己的私有模块代理,并简单地介绍一下七牛云推出的 goproxy.cn
以及它的出现对于中国 Go 语言开发者来说重要在何处。
目录
-
Go Modules 简介
-
快速迁移项目至 Go Modules
-
使用 Go Modules 时常遇见的坑
-
坑 1: 判断项目是否启用了 Go Modules
-
坑 2: 管理 Go 的环境变量
-
坑 3: 迁移至 Go Modules
-
坑 4: 拉取私有模块
-
坑 5: 更新现有的模块
-
坑 6: 主版本号
-
Go Module Proxy 简介
-
Goproxy 中国(goproxy.cn)
Go Modules 简介
Go modules (前身 vgo) 是 Go team (Russ Cox) 强推的一个理想化的类语言级依赖管理解决方案,它是和 Go1.11 一同发布的,在 Go1.13 做了大量的优化和调整,目前已经变得比较不错,如果你想用 Go modules,但还停留在 1.11/1.12 版本的话,强烈建议升级。
三个关键字
强推
首先这并不是乱说的,因为 Go modules 确实是被强推出来的,如下:
- 之前:大家都知道在 Go modules 之前还有一个叫 dep 的项目,它也是 Go 的一个官方的实验性项目,目的同样也是为了解决 Go 在依赖管理方面的短板。在 Russ Cox 还没有提出 Go modules 的时候,社区里面几乎所有的人都认为 dep 肯定就是未来 Go 官方的依赖管理解决方案了。
- 后来:谁都没想到半路杀出个程咬金,Russ Cox 义无反顾地推出了 Go modules,这瞬间导致一石激起千层浪,让社区炸了锅。大家一致认为 Go team 实在是太霸道、太独裁了,连个招呼都不打一声。我记得当时有很多人在网上跟 Russ Cox 口水战,各种依赖管理解决方案的专家都冒出来发表意见,讨论范围甚至一度超出了 Go 语言的圈子触及到了其他语言的领域。
理想化
从他强制要求使用语义化版本控制这一点来说就很理想化了,如下:
- Go modules 狠到如果你的 Tag 没有遵循语义化版本控制那么它就会忽略你的 Tag,然后根据你的 Commit 时间和哈希值再为你生成一个假定的符合语义化版本控制的版本号。
- Go modules 还默认认为,只要你的主版本号不变,那这个模块版本肯定就不包含 Breaking changes,因为语义化版本控制就是这么规定的啊。是不是很理想化。
类语言级:
这个关键词其实是我自己瞎编的,我只是单纯地个人认为 Go modules 在设计上就像个语言级特性一样,比如如果你的主版本号发生变更,那么你的代码里的 import path 也得跟着变,它认为主版本号不同的两个模块版本是完全不同的两个模块。此外,Go moduels 在设计上跟 go 整个命令都结合得相当紧密,无处不在,所以我才说它是一个有点儿像语言级的特性,虽然不是太严谨。
推 Go Modules 的人是谁
那么在上文中提到的 Russ Cox 何许人也呢,很多人应该都知道他,他是 Go 这个项目目前代码提交量最多的人,甚至是第二名的两倍还要多。
Russ Cox 还是 Go 现在的掌舵人(大家应该知道之前 Go 的掌舵人是 Rob Pike,但是听说由于他本人不喜欢特朗普执政所以离开了美国,然后他岁数也挺大的了,所以也正在逐渐交权,不过现在还是在参与 Go 的发展)。
Russ Cox 的个人能力相当强,看问题的角度也很独特,这也就是为什么他刚一提出 Go modules 的概念就能引起那么大范围的响应。虽然是被强推的,但事实也证明当下的 Go modules 表现得确实很优秀,所以这表明一定程度上的 “独裁” 还是可以接受的,至少可以保证一个项目能更加专一地朝着一个方向发展。
总之,无论如何 Go modules 现在都成了 Go 语言的一个密不可分的组件。
GOPATH
Go modules 出现的目的之一就是为了解决 GOPATH 的问题,也就相当于是抛弃 GOPATH 了。
Opt-in
Go modules 还处于 Opt-in 阶段,就是你想用就用,不用就不用,不强制你。但是未来很有可能 Go2 就强制使用了。
"module" != "package"
有一点需要纠正,就是“模块”和“包”,也就是 “module” 和 “package” 这两个术语并不是等价的,是 “集合” 跟 “元素” 的关系,“模块” 包含 “包”,“包” 属于 “模块”,一个 “模块” 是零个、一个或多个 “包” 的集合。
Go Modules相关属性
go.mod
module example.com/foobar
go 1.13
require (
example.com/apple v0.1.2
example.com/banana v1.2.3
example.com/banana/v2 v2.3.4
example.com/pineapple v0.0.0-20190924185754-1b0db40df49a
)
exclude example.com/banana v1.2.4
replace example.com/apple v0.1.2 => example.com/rda v0.1.0
replace example.com/banana => example.com/hugebanana
go.mod 是启用了 Go moduels 的项目所必须的最重要的文件,它描述了当前项目(也就是当前模块)的元信息,每一行都以一个动词开头,目前有以下 5 个动词:
- module:用于定义当前项目的模块路径。
- go:用于设置预期的 Go 版本。
- require:用于设置一个特定的模块版本。
- exclude:用于从使用中排除一个特定的模块版本。
- replace:用于将一个模块版本替换为另外一个模块版本。
这里的填写格式基本为包引用路径+版本号,另外比较特殊的是 go $version
,目前从 Go1.13 的代码里来看,还只是个标识作用,暂时未知未来是否有更大的作用。
go.sum
go.sum 是类似于比如 dep 的 Gopkg.lock 的一类文件,它详细罗列了当前项目直接或间接依赖的所有模块版本,并写明了那些模块版本的 SHA-256 哈希值以备 Go 在今后的操作中保证项目所依赖的那些模块版本不会被篡改。
example.com/apple v0.1.2 h1:WX...
example.com/apple v0.1.2/go.mod h1:xHW...
example.com/banana v1.2.3/go.mod h1:HS...
...
我们可以看到一个模块路径可能有如下两种:
example.com/apple v0.1.2 h1:WXk...
example.com/apple v0.1.2/go.mod h1:xH...
前者为 Go modules 打包整个模块包文件 zip 后再进行 hash 值,而后者为针对 go.mod 的 hash 值。他们两者,要不就是同时存在,要不就是只存在 go.mod hash。
那什么情况下会不存在 zip hash 呢,就是当 Go 认为肯定用不到某个模块版本的时候就会省略它的 zip hash,就会出现不存在 zip hash,只存在 go.mod hash 的情况。
GO111MODULE
这个环境变量主要是 Go modules 的开关,主要有以下参数:
- auto:只在项目包含了 go.mod 文件时启用 Go modules,在 Go 1.13 中仍然是默认值,详见 :golang.org/issue/31857。
- on:无脑启用 Go modules,推荐设置,未来版本中的默认值,让 GOPATH 从此成为历史。
- off:禁用 Go modules。
GOPROXY
这个环境变量主要是用于设置 Go 模块代理,主要如下:
- 它的值是一个以英文逗号 “,” 分割的 Go module proxy 列表(稍后讲解)
- 作用:用于使 Go 在后续拉取模块版本时能够脱离传统的 VCS 方式从镜像站点快速拉取。它拥有一个默认值,但很可惜
proxy.golang.org
在中国无法访问,故而建议使用goproxy.cn
作为替代。 - 设置为 “off” :禁止 Go 在后续操作中使用任 何 Go module proxy。
刚刚在上面,我们可以发现值列表中有 “direct” ,它又有什么作用呢?
其实值列表中的 “direct” 为特殊指示符,用于指示 Go 回源到模块版本的源地址去抓取 (比如 GitHub 等),当值列表中上一个 Go module proxy 返回 404 或 410 错误时,Go 自动尝试列表中的下一个,遇见 “direct” 时回源,遇见 EOF 时终止并抛出类似 “invalid version: unknown revision…” 的错误。
GOSUMDB
它的值是一个 Go checksum database,用于使 Go 在拉取模块版本时(无论是从源站拉取还是通过 Go module proxy 拉取)保证拉取到的模块版本数据未经篡改,也可以是“off”即禁止 Go 在后续操作中校验模块版本
- 格式:
SUMDB_NAME+PUBLIC_KEY
或SUMDB_NAME+PUBLIC_KEY SUMDB_URL
。 - 拥有默认值:
sum.golang.org
(之所以没有按照上面的格式是因为 Go 对默认值做了特殊处理)。 - 可被 Go module proxy 代理 (详见:Proxying a Checksum Database)。
- GOSUMDB 的默认值在中国无法访问,故而更加建议将 GOPROXY 设置为
goproxy.cn
,因为goproxy.cn
支持代理sum.golang.org
。
Go Checksum Database
Go checksum database 主要用于保护 Go 不会从任何源头拉到被篡改过的非法 Go 模块版本,其作用(左)和工作机制(右)如下图:
如果有兴趣的小伙伴可以看看 Proposal: Secure the Public Go Module Ecosystem,有详细介绍其算法机制,如果想简单一点,查看 go helpmodule-auth
也是一个不错的选择。
GONOPROXY/GONOSUMDB/GOPRIVATE
这三个环境变量都是用在当前项目依赖了私有模块,也就是依赖了由 GOPROXY 指定的 Go module proxy 或由 GOSUMDB 指定 Go checksum database 无法访问到的模块时的场景,他们具有如下特性:
- 它们三个的值都是一个以英文逗号 “,” 分割的模块路径前缀,匹配规则同 path.Match。
- 其中 GOPRIVATE 较为特殊,它的值将作为 GONOPROXY 和 GONOSUMDB 的默认值,所以建议的最佳姿势是只是用 GOPRIVATE。
在使用上来讲,比如 GOPRIVATE=*.corp.example.com
表示所有模块路径以 corp.example.com
的下一级域名 (如 team1.corp.example.com
) 为前缀的模块版本都将不经过 Go module proxy 和 Go checksum database,需要注意的是不包括 corp.example.com
本身。
Global Caching
这个主要是针对 Go modules 的全局缓存数据说明,如下:
- 同一个模块版本的数据只缓存一份,所有其他模块共享使用。
- 目前所有模块版本数据均缓存在
$GOPATH/pkg/mod
和$GOPATH/pkg/sum
下,未来或将移至$GOCACHE/mod
和$GOCACHE/sum
下( 可能会在当$GOPATH
被淘汰后)。 - 可以使用
go clean-modcache
清理所有已缓存的模块版本数据。
另外在 Go1.11 之后 GOCACHE 已经不允许设置为 off 了,我想着这也是为了模块数据缓存移动位置做准备,因此大家应该尽快做好适配。
快速迁移项目至 Go Modules
-
升级到 Go 1.13。
-
让 GOPATH 从你的脑海中完全消失,早一步踏入未来。
-
修改 GOBIN 路径(可选)。
-
打开 Go modules 的开关。
-
设置 GOPROXY。
-
按照你喜欢的目录结构重新组织你的所有项目。
-
在你项目的根目录下执行
go mod init<OPTIONAL_MODULE_PATH>
以生成 go.mod 文件。 -
想办法说服你身边所有的人都去走一下前四步。
迁移后 go get 行为的改变
这里我们注意到有两点比较特别,分别是:
- 第一点:为什么 “拉取 hash 为 342b231 的 commit,最终会被转换为 v0.3.2” 呢。这是因为虽然我们设置了拉取 @342b2e commit,但是因为 Go modules 会与 tag 进行对比,若发现对应的 commit 与 tag 有关联,则进行转换。
- 第二点:为什么不建议使用
go mod vendor
,因为 Go modules 正在淡化 Vendor 的概念,很有可能 Go2 就去掉了。
使用 Go Modules 时常遇见的坑
坑 1: 判断项目是否启用了 Go Modules
坑 2: 管理 Go 的环境变量
这里主要是提到 Go1.13 新增了 go env-w
用于写入环境变量,而写入的地方是 os.UserConfigDir
所返回的路径,需要注意的是 go env-w
不会覆写。
坑 3: 从 dep、glide 等迁移至 Go Modules
这里主要是指从旧有的依赖包管理工具(dep/glide 等)进行迁移时,因为 BUG 的原因会导致不经过 GOPROXY 的代理,解决方法有如下两个:
- 手动创建一个 go.mod 文件,再执行 go mod tidy 进行补充。
- 上代理,相当于不使用 GOPROXY 了。
坑 4:拉取私有模块
这里主要想涉及两块知识点,如下:
- GOPROXY 是无权访问到任何人的私有模块的,所以你放心,安全性没问题。
- GOPROXY 除了设置模块代理的地址以外,还需要增加 “direct” 特殊标识才可以成功拉取私有库。
坑 5:更新现有的模块
坑 6:主版本号
Go Module Proxy 简介
在这里再次强调了 Go Module Proxy 的作用(图左),以及其对应的协议交互流程(图右),有兴趣的小伙伴可以认真看一下。
Goproxy 中国
在这块主要介绍了 Goproxy 的一些实践操作以及 goproxy.cn 的一些 Q&A 和 近况,如下:
Q&A
Q:如果中国 Go 语言社区没有咱们自己家的 Go Module Proxy 会怎么样?
A:
在 Go 1.13 中 GOPROXY 和 GOSUMDB 这两个环境变量都有了在中国无法访问的默认值,尽管我在 golang.org/issue/31755 里努力尝试过,但最终仍然无法为咱们中国的 Go 语言开发者谋得一个完美的解决方案。所以从今以后咱 们中国的所有 Go 语言开发者,只要是 使用了 Go modules 的,那么都必须先修改 GOPROXY 和 GOSUMDB 才能正常使用 Go 做开发,否则可能连一个最简单的程序都跑不起 来(只要它有依 赖第三方模 块)。
Q:我创建 Goproxy 中国(goproxy.cn)的主要原因?
A:
其实更早的时候,也就是今年年初我也曾试图在 golang.org/issue/31020 中请求 Go team 能想办法避免那时的 GOPROXY 即将拥有的默认值可以在中国正常访问,但 Go team 似乎也无能为力,为此我才坚定了创建 goproxy.cn 的信念。既然别人没法儿帮忙,那咱们就 得自己动手,不为别的,就为了让大家以后能够更愉快地使用 Go 语言配合 Go modules 做开发。
最初我先是和七牛云的许叔(七牛云的 创始人兼 CEO 许式伟)提出了我打算 创建 goproxy.cn 的想法,本是抱着试试看的目的,但没想到许叔几乎是没有超过一分钟的考虑便认可了我的想法并表示愿意一起推动。那一阵子刚好赶上我在写毕业论文,所以项目开发完后就 一直没和七牛云做交接,一直跑在我的个人服 务器上。直到有一次 goproxy.cn 被攻击了,一下午的功夫烧了我一百多美元,然后我才 意识到这种项目真不能个人来做。个人来做不靠 谱,万一依赖这个项目的人多了,项目再出什么事儿,那就会给大家成不必要的损 失。所以我赶紧和七牛云做了交接,把 goproxy.cn 完全交给了七牛云,甚至连域名都过户了去。
近况
- Goproxy 中国 (goproxy.cn) 是目前中国最可靠的 Go module proxy (真不是在自卖自夸)。
- 为中国 Go 语言开发者量身打造,支持代理 GOSUMDB 的默认值,经过全球 CDN 加速,高可用,可 应用进公司复杂的开发环境中,亦可用作上游代理。
- 由中国倍受信赖的云服务提供商七牛云无偿提供基础设施支持的开源的非营利性项目。
- 目标是为中国乃至全世界的 Go 语言开发者提供一个免 费的、可靠的、持续在线的且经过 CDN 加速的 Go module proxy。
- 域名已由七牛云进行了备案 (沪ICP备11037377号-56)。
情况
此处呈现的是存储大小,主要是针对模块包代码,而一般来讲代码并不会有多大,0-10MB,10-50MB 占最大头,也是能够理解,但是大于 100MB 的模块包代码就比较夸张了。
此时主要是展示了一下近期 goproxy.cn 的网络数据情况,我相信未来是会越来越高的,值得期待。
Q&A
Q:如何解决 Go 1.13 在从 GitLab 拉取模块版本时遇到的,Go 错误地按照非期望值的路径寻找目标模块版本结果致使最终目标模块拉取失败的问题?**
A:
GitLab 中配合 goget
而设置的 <meta>
存在些许问题,导致 Go 1.13 错误地识别了模块的具体路径,这是个 Bug,据说在 GitLab 的新版本中已经被修复了,详细内容可以看 https://github.com/golang/go/issues/34094 这个 Issue。然后目前的解决办法的话除了升级 GitLab 的版本外,还可以参考 https://github.com/developer-learning/night-reading-go/issues/468#issuecomment-535850154 这条回复。
Q:使用 Go modules 时可以同时依赖同一个模块的不同的两个或者多个小版本(修订版本号不同)吗?
A:
不可以的,Go modules 只可以同时依赖一个模块的不同的两个或者多个大版本(主版本号不同)。比如可以同时依赖 example.com/foobar@v1.2.3
和 example.com/foobar/v2@v2.3.4
,因为他们的模块路径(module path)不同,Go modules 规定主版本号不是 v0
或者 v1
时,那么主版本号必须显式地出现在模块路径的尾部。但是,同时依赖两个或者多个小版本是不支持的。比如如果模块 A 同时直接依赖了模块 B 和模块 C,且模块 A 直接依赖的是模块 C 的 v1.0.0
版本,然后模块 B 直接依赖的是模块 C 的 v1.0.1
版本,那么最终 Go modules 会为模块 A 选用模块 C 的 v1.0.1
版本而不是模块 A 的 go.mod
文件中指明的 v1.0.0
版本。
这是因为 Go modules 认为只要主版本号不变,那么剩下的都可以直接升级采用最新的。但是如果采用了最新的结果导致项目 Break 掉了,那么 Go modules 就会 Fallback 到上一个老的版本,比如在前面的例子中就会 Fallback 到 v1.0.0
版本。
Q:在 go.sum
文件中的一个模块版本的 Hash 校验数据什么情况下会成对出现,什么情况下只会存在一行?
A:通常情况下,在 go.sum
文件中的一个模块版本的 Hash 校验数据会有两行,前一行是该模块的 ZIP 文件的 Hash 校验数据,后一行是该模块的 go.mod
文件的 Hash 校验数据。但是也有些情况下只会出现一行该模块的 go.mod
文件的 Hash 校验数据,而不包含该模块的 ZIP 文件本身的 Hash 校验数据,这个情况发生在 Go modules 判定为你当前这个项目完全用不到该模块,根本也不会下载该模块的 ZIP 文件,所以就没必要对其作出 Hash 校验保证,只需要对该模块的 go.mod
文件作出 Hash 校验保证即可,因为 go.mod
文件是用得着的,在深入挖取项目依赖的时候要用。
Q:能不能更详细地讲解一下 go.mod
文件中的 replace
动词的行为以及用法?
A:这个 replace
动词的作用是把一个“模块版本”替换为另外一个“模块版本”,这是“模块版本”和“模块版本(module path)”之间的替换,“=>”标识符前面的内容是待替换的“模块版本”的“模块路径”,后面的内容是要替换的目标“模块版本”的所在地,即路径,这个路径可以是一个本地磁盘的相对路径,也可以是一个本地磁盘的绝对路径,还可以是一个网络路径,但是这个目标路径并不会在今后你的项目代码中作为你“导入路径(import path)”出现,代码里的“导入路径”还是得以你替换成的这个目标“模块版本”的“模块路径”作为前缀。
另外需要注意,Go modules 是不支持在 “导入路径” 里写相对路径的。举个例子
,如果项目 A 依赖了模块 B,比如模块 B 的“模块路径”是 example.com/b
,然后它在的磁盘路径是 ~/b
,在项目 A 里的 go.mod
文件中你有一行 replace example.com/b=>~/b
,然后在项目 A 里的代码中的“导入路基”就是 import"example.com/b"
,而不是 import"~/b"
,剩下的工作是 Go modules 帮你自动完成了的。
然后就是我在分享中也提到了, exclude
和 replace
这两个动词只作用于当前主模块,也就是当前项目,它所依赖的那些其他模块版本中如果出现了你待替换的那个模块版本的话,Go modules 还是会为你依赖的那个模块版本去拉取你的这个待替换的模块版本。
举个例子,
比如项目 A 直接依赖了模块 B 和模块 C,然后模块 B 也直接依赖了模块 C,那么你在项目 A 中的 go.mod
文件里的 replace c=>~/some/path/c
是只会影响项目 A 里写的代码中,而模块 B 所用到的还是你 replace
之前的那个 c
,并不是你替换成的 ~/some/path/c
这个。
总结
在 Go1.13 发布后,接触 Go modules 和 Go module proxy 的人越来越多,经常在各种群看到各种小伙伴在咨询,包括我自己也贡献了好几枚 “坑”,傲飞的这一次 《Go Modules、Go Module Proxy 和 goproxy.cn》的技术分享,非常的有实践意义。如果后续大家还有什么建议或问题,欢迎随时来讨论。
最后,感谢在 goproxy.cn 背后的人们(@七牛云 和 @盛傲飞)对中国 Go 语言社区的无私贡献和奉献。