由 naruse 发表于 2023-11-12
我们很高兴地宣布 Ruby 3.3.0-preview3 发布。 Ruby 3.3 新增了 Prism 解析器,使用 Lrama 作为解析生成器,新增了纯 Ruby 实现的 JIT 编译器 RJIT,另有许多性能改进,尤其是 YJIT。
Prism
- 引入 Prism 解析器 为默认 gem
- Prism 是一个可移植、容错且可维护的 Ruby 语言递归下降解析器
- Prism 已可用于生产环境,并得到了积极维护,您可以使用它来代替 Ripper
- 有关于如何使用 Prism 的 详细文档
- Prism 既是 CRuby 内部使用的 C 库,也是任何需要解析 Ruby 代码的工具可以使用的 Ruby gem
- Prism API 中值得注意的方法有:
Prism.parse(source)
返回 AST 作为 ParseResult 的一部分Prism.dump(source)
将序列化的 AST 以字符串形式返回Prism.parse_comments(source)
返回注释
- 如果您有兴趣贡献,可以直接在 Prism 代码库 上提出拉取请求或报告问题
使用 Lrama 替代 Bison
- 使用 Lrama LALR 解析生成器 替换 Bison Feature #19637
- 如果您有兴趣,请参阅 Ruby 解析器的未来愿景
- Lrama 内部解析器被 Racc 生成的 LR 解析器替换,以便于维护
- 已支持参数化规则
(?, *, +)
,将被用于 Ruby parse.y 中
RJIT
- 引入了纯 Ruby 的 JIT 编译器 RJIT 并替代 MJIT。
- RJIT 仅支持 x86_64 架构上的 Unix 平台。
- 不同于 MJIT,RJIT在运行时不需要 C 编译器。
- RJIT 目前仅用于实验目的。
- 您在生产环境中应当继续使用 YJIT。
- 如果您有兴趣为 Ruby 开发 JIT,请查看 k0kubun 在 RubyKaigi 第 3 天 中的演讲。
YJIT
- 相对于 3.2 的主要性能提升
- 改进了 splat 和 rest 参数支持。
- 虚拟机的栈操作分配了寄存器。
- 更多带有可选参数的调用被编译。
- 错误处理也被编译。
- 拥有复杂对象形状的实例变量不再退出到解释器执行。
- 不支持的调用类型不再退出到解释器执行。
- 特别优化了
Integer#!=
,String#!=
,Kernel#block_given?
,Kernel#is_a?
,Kernel#instance_of?
,Module#===
。 - 目前比 optcarrot 的解释器快 3 倍以上!
- 内存利用率相交 3.2 有显著提升
- 编译代码使用的元数据使用更少的内存。
- 在 ARM64 中的生成更紧凑的代码。
- 编译速度现在略快于 3.2。
- 新增
RubyVM::YJIT.enable
可以在运行时启用 YJIT- 您可以在不修改命令行参数或环境变量的情况下启用 YJIT。
- 这也可以用于在应用程序启动完成后,仅启用 YJIT 一次。当您在启动程序时禁用了 YJIT ,您可以通过
--yjit-disable
来使用其他 YJIT 选项。
- 提供了禁用代码 GC 的选项,并视
--yjit-exec-mem-size
为硬限制。- 可以在使用 unicorn 和进程 forking 的服务器上产生更好的写时复制行为。
- 发布版本中,现在可以用到通过
--yjit-stats
产生的ratio_in_yjit
统计信息,不再需要特殊的统计信息或开发版本。 - 退出跟踪选项现在支持采样
--trace-exits-sample-rate=N
- 新增
--yjit-perf
以便于利用 Linux perf 进行性能分析。 - 更彻底的测试及多个错误修复
M:N 线程调度器
- 引入了 M:N 线程调度器。[Feature #19842]
- M 个 Ruby 线程由 N 个原生线程(OS 线程)管理,从而降低线程创建和管理成本。
- 由于可能会破坏 C 扩展的兼容性,因此在默认情况下,主 Ractor 上禁用 M:N 线程调度器。
- 可通过环境变量
RUBY_MN_THREADS=1
在主 Ractor 上启用 M:N 线程。 - 非主 Ractor 上启用 M:N 线程。
- 可通过环境变量
- 可通过环境变量
RUBY_MAX_CPU=n
设置N
的最大值(原生线程的最大数量)。默认值为 8。- 由于每个 Ractor 中只能同时运行一个 Ruby 线程,因此将使用原生线程的数量,即
RUBY_MAX_CPU
和运行中的 Ractor 数量中较小的值。因此单 Ractor 应用程序(大多数应用程序)将使用 1 个原生线程。 - 为了支持阻塞操作,可以使用多于
N
个原生线程。
- 由于每个 Ractor 中只能同时运行一个 Ruby 线程,因此将使用原生线程的数量,即
其他值得关注的新功能
语言
性能提升
- 根据对象形状,优化
defined?(@ivar)
。 - 诸如
Socket.getaddrinfo
的域名解析现在可以被中断(在 pthreads 可用的环境中)。Feature #19965- 为此,现在每当调用 getaddrinfo 或 getnameinfo 时都会创建一个 pthread。 这会在域名解析中产生一些开销(在我们的实验中约为 2.5 倍)。 我们预计域名解析开销不会成为大多数应用程序的问题,但如果您观察到这种情况,或者您认为此更改造成了意外的影响,请向我们报告。
- 新增环境变量
RUBY_GC_HEAP_REMEMBERED_WB_UNPROTECTED_OBJECTS_LIMIT_RATIO
。 Feature #19571 - 旧对象的子对象不再立即提升到垃圾收集器中的老一代。 功能 #19678
- 垃圾收集器中添加了对弱引用的支持。 功能 #19783
自 3.2 以来,其他值得注意的变化
IRB
IRB 进行了多项增强功能,包括但不限于:
- 高级
irb:rdbg
集成,提供了类似pry-byebug
的调试体验(文档)。 - 为
ls
和show_cmds
这样的方法提供分页支持。 - 为
ls
和show_source
方法提供更准确更有用的信息。 - 实验性的基于类型分析的自动补全功能(文档)。
- 现在可以通过新引入的类 Reline::Face 来更改自动补全对话框中的字体颜色和字体样式(文档)。
另外,IRB 还进行了广泛的重构,修复了数十个错误,以便未来的增强。
兼容性问题
注意:不包括 bug 修复。
移除的常量
移除了以下已废弃的常量。
移除的方法
移除了以下已废除的方法。
移除的环境变量
下列废弃方法被移除
- 环境变量
RUBY_GC_HEAP_INIT_SLOTS
被废弃,并不再产生实际作用。请使用环境变量RUBY_GC_HEAP_{0,1,2,3,4}_INIT_SLOTS
进行替代。 Feature #19785
Stdlib 兼容性问题
ext/readline
已退役
- 我们有了纯 Ruby 实现的
reline
,兼容ext/readline
API。未来我们将依赖reline
。如果您需要使用ext/readline
,可以通过 rubygems.org 进行安装gem install readline-ext
。 - 我们不再需要安装类似
libreadline
或libedit
这样的库了。
C API 更新
更新的 C API
更新了以下 API。
已移除的 C API
移除了以下废弃的 API。
标准库更新
当用户 require 在将来 Ruby 版本中成为绑定 gem 的库时,RubyGems 和 Bundler 会发出警告。
这些库包括:
- abbrev
- base64
- bigdecimal
- csv
- drb
- getoptlong
- mutex_m
- nkf
- observer
- racc
- resolv-replace
- rinda
- syslog
新增以下默认 gem。
- prism 0.15.1
更新了以下默认 gems。
- RubyGems 3.5.0.dev
- base64 0.2.0
- benchmark 0.3.0
- bigdecimal 3.1.5
- bundler 2.5.0.dev
- cgi 0.4.0
- csv 3.2.8
- date 3.3.4
- delegate 0.3.1
- drb 2.2.0
- english 0.8.0
- erb 4.0.3
- etc 1.4.3.dev.1
- fcntl 1.1.0
- fiddle 1.1.2
- fileutils 1.7.2
- find 0.2.0
- getoptlong 0.2.1
- io-console 0.6.1.dev
- irb 1.8.3
- logger 1.6.0
- mutex_m 0.2.0
- net-http 0.4.0
- net-protocol 0.2.2
- nkf 0.1.3
- observer 0.1.2
- open-uri 0.4.0
- open3 0.2.0
- openssl 3.2.0
- optparse 0.4.0
- ostruct 0.6.0
- pathname 0.3.0
- pp 0.5.0
- prettyprint 0.2.0
- pstore 0.1.3
- psych 5.1.1.1
- rdoc 6.6.0
- reline 0.3.9
- rinda 0.2.0
- securerandom 0.3.0
- shellwords 0.2.0
- singleton 0.2.0
- stringio 3.0.9
- strscan 3.0.7
- syntax_suggest 1.1.0
- tempfile 0.2.0
- time 0.3.0
- timeout 0.4.1
- tmpdir 0.2.0
- tsort 0.2.0
- un 0.3.0
- uri 0.13.0
- weakref 0.1.3
- win32ole 1.8.10
- yaml 0.3.0
- zlib 3.1.0
以下默认 gem 成为绑定 gem
- racc 1.7.3
更新了以下绑定 gems。
- minitest 5.20.0
- rake 13.1.0
- test-unit 3.6.1
- rexml 3.2.6
- rss 0.3.0
- net-imap 0.4.4
- net-smtp 0.4.0
- rbs 3.2.2
- typeprof 0.21.8
- debug 1.8.0
有关默认 gems 和 绑定 gems 的细节,可以参考 GitHub 上的发布,例如 logger gem 或相应的变更日志。
自 Ruby 3.2.0 以来,5207 个文件被更改,新增 284820 行(+), 删除 174773 行(-)!
下载
-
https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.tar.gz
SIZE: 21550473 SHA1: 2811f191d66dffee0206771873bd990857ae4ed6 SHA256: 0969141be92e67e0edb84a8fb354acc98f01bd78e602a23a0f136045c82f4809 SHA512: 94db07a6958c09809b2e5b597fa55a121074e8bacb3bf588c83cf0d35b07a8b070172035a49d1abf0d8ee364a9ace824f34e677f7327ffe1acdbab0938ac49c4
-
https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.tar.xz
SIZE: 15970144 SHA1: 496600612605f8ebeb955255e98bac73a4cbc045 SHA256: f79afcf122dc7d04fe26cfa4436b9c488b21766fc54b0d2dfb2ba41cd0cdd355 SHA512: d7ab0d703e7884efd31045933409cd68fac1d9941963537ccc8e309ca7c8bee8500a68182135acba22cbdbf4a8ae99f39bf7f0925273eb4fbc3728c0c1ba0c19
-
https://cache.ruby-lang.org/pub/ruby/3.3/ruby-3.3.0-preview3.zip
SIZE: 26618303 SHA1: 6a13e08c7e484d42037c1e2c87c5d0e220f893a0 SHA256: c35bf637a647c2f60148368ffb374db5c258570911794f46b6dfdb98ebfe95d9 SHA512: c4ef2cdcdadeb85ad1d42aedc97f9f3d609b3b01eea2319451cf92c81bd31ae8129b7c91fc68571469dd888c01ea0f48f73234b965db17f6a87404ca382f7794
什么是 Ruby
Ruby 最初由 Matz (松本行弘,Yukihiro Matsumoto) 于 1993 年开发,现在以开源软件的形式开发。它可以在多个平台上运行,并在全球得到广泛使用,尤其是Web开发领域。