[240610] 5 种 Non-Posix Shell 在 x-cmd 上的支持 | Perl 发布 5.40.0
利用三天假期,我开始动手增加了对各种 Non-Posix shell 的 x-cmd 支持。 在这个过程中,边学边用了 nushell / fish / xonsh / csh 。
进展比较顺利,现在 nushell/fish/xonsh/csh 可以调用 x , 以及 c 启动我们的快速路径切换,以及 @gpt, @gemini, @o 进行 LLM Agent 的调用。相关的工作会在 v0.3.10 发布;但注意,对非 posix shell 的支持仍是 beta 特性。
nushell
nushell 的流式设计与 jq 很接近,并引入大量 函数编程 的理念 — 彼之,汝之蜂密 。
我对此非常感兴趣,nushell 以数据流为目标,与 x-cmd 下一步的设计理念非常契合。
fish
fish 设计很清爽,其成型较晚,集各 shell 之大成 但仍能保持语法的简明。 虽然近十年不时注意 fishshell 的新闻,但也前天才发现开始 fish 也开始 rust 化,这是一个好的兆头 — 重写这个行为本身就会向该项目注入新的活力 — 至少,我们可以期待 portable fish 的出现。
xonsh
python 的元素故然让人振奋,但整体看上来有点复杂。 也许站在 python 高阶用户的角度,这种复杂度毫无压力。
python 自带电池 的设计理念,使其很容易整合大量有趣的功能。xonsh 可谓这个流派的集大成者,python 发烧友切勿错过。
csh
虽然 Freebsd 的 default shell 是 poxis 的 bsh,但其 login shell 是 csh 。
在使用过程,发现 csh 以 word list 为首要数据假设的思路非常有趣 — 我现在算是想明白了,也许 bash 的作者因为不舍得这个特性,才导致复杂性剧增。
csh 支持 goto,但不支持 function — 对于有 eval 的动态语言,有限地解决这个问题也不算困难。也许在最早期的语言设计时, 最小化语言设计应该包含什么元素,仍是百花齐放,并无一致的共识。
不过,我遇到了一个问题,无法在不依赖外部文件的方式解决。就此问题我向 tcsh 官方发了 issue。 https://github.com/tcsh-org/tcsh/issues/108
pwsh
我们一直都通过 pwsh 模块,调用 powershell 以复用 windows 上已有的强大的命令行能力(系统信息的获取,scoop 安装以及增强)。
不过,由于 git-for-windows 上的 UNIX 路径转换 ,以及一些可能未知的设计细节( windows/posix 之间衔接的复杂性 ),我们会在七月份才开始 pwsh 的收尾工作。
Perl 5.40.0 更新摘要
核心增强
- 新增 __CLASS__ 关键字: 在 class 特性中,方法、ADJUST 块和字段初始化表达式可以使用 __CLASS__ 关键字获取运行时类名,方便方法调度。 (参考 perlfunc 中的 __CLASS__)
- 字段变量的 :reader 属性: class 特性中,字段变量可以使用 :reader 属性自动生成读取器方法。 (参考 perlclass 中的 :reader)
- -M 命令行选项允许空格: -M 开关和模块名之间允许有空格。
- 限制 use VERSION 声明: 将 5.11 以上版本的 use VERSION 声明降级到 5.11 以下版本现在是致命错误。连续使用 use VERSION 声明,且其中一个版本大于等于 5.39,也是致命错误。
- 新增 builtin::inf 和 builtin::nan 函数 (实验性): 提供浮点数无穷大和非数字值。
- 新增 ^^ 逻辑异或运算符: 补充了中等优先级逻辑运算符。
- try/catch 特性不再是实验性的: 从 Perl 5.34.0 开始引入的 try/catch 错误处理机制现在被认为是稳定的。
- for 迭代多个值不再是实验性的: 从 Perl 5.36.0 开始引入的 for 迭代多个值特性现在被认为是稳定的。
- builtin 模块不再是实验性的: 从 Perl 5.36.0 开始引入的 builtin 模块现在被认为是稳定的,但其中一些函数仍然是实验性的。
- :5.40 特性包添加了 try: 最新的版本特性包现在包含最近稳定的 try 特性。
- use v5.40; 导入内置函数: 除了导入特性包之外,use v5.40; (或更高版本) 还导入相应的内置版本包。
安全性
- CVE-2023-47038: 修复了通过非法用户定义的 Unicode 属性导致的缓冲区溢出漏洞。
- CVE-2023-47039: 修复了 Windows 平台上的二进制劫持漏洞。
不兼容的变化
- reset EXPR 现在会调用标量的 set-magic 方法: 这可能会导致以前没有效果的代码现在产生效果,甚至抛出异常。
- 调用未知包的 import 方法会产生警告: 这有助于在不区分大小写的文件系统上检测 use 语句中的大小写错误。
- return 不再允许间接对象: 这消除了语法上的歧义和潜在的混乱。
弃用
- 使用 goto 从外部作用域跳转到内部作用域已被弃用,并将在 Perl 5.42 中完全移除。
性能提升
- 优化了否定运算符的性能。
模块和编译指示
- 新增模块: Term::Table 和 Test2::Suite。
- 更新模块: 包括 Archive::Tar、attributes、autodie、B、B::Deparse、Benchmark、bignum、builtin、bytes、Compress::Raw::Bzip2、Compress::Raw::Zlib、CPAN::Meta::Requirements、Data::Dumper、DB_File、Devel::Peek、Devel::PPPort、diagnostics、DynaLoader、Encode、Errno、experimental、Exporter、ExtUtils::CBuilder、ExtUtils::Manifest、ExtUtils::Miniperl、Fcntl、feature、fields、File::Compare、File::Find、File::Glob、File::Spec、File::stat、FindBin、Getopt::Long、Getopt::Std、Hash::Util、Hash::Util::FieldHash、HTTP::Tiny、I18N::Langinfo、IO、IO-Compress、IO::Socket::IP、IO::Zlib、locale、Math::BigInt、Math::BigInt::FastCalc、Module::CoreList、Module::Metadata、mro、NDBM_File、Opcode、perl5db.pl、perlfaq、PerlIO::encoding、PerlIO::scalar、PerlIO::via、Pod::Checker、Pod::Html、Pod::Simple、podlators、POSIX、re、Safe、SelfLoader、Socket、strict、Test::Harness、Test::Simple、Text::Tabs、Text::Wrap、threads、threads::shared、Tie::File、Time::gmtime、Time::HiRes、Time::Local、Time::localtime、Time::tm、UNIVERSAL、User::grent、User::pwent、version、warnings、XS::APItest 和 XS::Typemap。
文档
- 更新了文档以反映此版本中的更改。
- 对 perlapi、perlclass、perlfunc、perlguts、perlclib、perlhacktips、perllol、perlre、perlref、perlop 和 perlvar 进行了其他改进。
诊断
- 添加了新的错误和警告消息。
- 改进了现有诊断消息的清晰度和准确性。
配置和编译
- 移除了 microperl。
- 修复了在不同语言环境下探测 LC_ALL 语法的 here-doc 问题。
- 现在可以使用 -Accflags=-DPERL_USE_HWM 和 -Accflags=-DPERL_NO_HWM 分别启用或禁用非调试和调试构建的高水位线检查。
测试
- 添加和更改了测试以反映此版本中的其他添加和更改。
- 对测试套件进行了重大改进,包括更新 nm 输出解析、处理 BusyBox 系统上的测试失败、使用更便携的方式获取对象文件中定义的名称以及添加广泛的语言环境处理压力测试。
平台支持
- 新增平台: Serenity OS。
- 平台特定说明: Windows、Linux、MacOS/Darwin 和 VMS。
内部变化
- 添加了 PERL_RC_STACK 构建选项,该选项目前是实验性的,并默认禁用。
- 添加了一个新的 API 函数 newLISTOPn(),用于简化创建 LISTOP optree 片段的 C (或 XS) 代码。
- eval_sv() API 现在接受 G_USEHINTS 标志,该标志使用来自 PL_curcop 的提示(例如 strict 和 features),而不是默认的默认提示。
- 修复了 PERL_VERSION_LE 以正确检查“小于或等于”,而不是“小于”。
- dAX、dITEMS 和 dXSARGS 现在将 AX 和 items 声明为 Stack_off_t,而不是 SSize_t。
- 为 XS 代码添加了一个新函数 sv_langinfo,它提供与现有 Perl_langinfo8 相同的信息,但返回一个 SV 而不是 char *。
- glibc 有一个未记录的等效函数来查询 locale(),当使用此函数时,它消除了 perl 保留自己记录的需要,因此效率更高,并保证准确。可以通过定义 NO_NL_LOCALE_NAME 构建选项来禁用此函数的使用。
选定的错误修复
- 修复了与 Unicode 定界符、use 5.36、闭包清理、字符串操作、类继承、state 变量、数组操作、-X 标志、内存泄漏、词法作用域、join() 函数、dbstate 操作符、语言环境处理、正则表达式引擎 、临时堆栈、词法子例程和 prepare_export_lexical() 函数相关的大量错误。
已知问题
- Windows 上的 perlivp 缺少 streamzip。
先前版本的勘误表
- 更新了 perl5300delta,以包含与 $[ 同时删除的 arybase 模块的删除。
致谢
- 感谢所有为 Perl 5.40.0 做出贡献的人员。
报告错误
- 如果您发现任何问题,请在 https://github.com/Perl/perl5/issues 上提交问题报告。
致谢
- 您可以通过运行 perlthanks 程序来感谢 Perl 5 移植者。
另请参阅
- Changes 文件:详细说明如何查看更改的详细信息。
- INSTALL 文件:介绍如何构建 Perl。
- README 文件:介绍一般内容。
- Artistic 和 Copying 文件:版权信息。
以上文章采用 Gemini Pro 1.5 生成摘要,命令如下:
更多内容请查阅 : blog-240610
关注官方微信公众号:oh my x
获取开源软件和 x–cmd 的最新用法
独家资讯
Perl基础实例—计数
统计数据是Perl最常用的功能。 今天我们通过一个简单的例子来看下如何统计数据。
题目:统计下列字符串中所有字母出现的次数
ATCCCGAAGGTAGATAACCGATTAGACG
分析:
我们需要统计每个字母出现的次数, 因此我们可以选用散列这个数据结构来进行数据的存储以及统计。
先定义数据和散列:
我们先把字符串根据单个字符拆分成字符数组:
split 是系统内置函数, 作用是将字符串根据给定的分隔符, 切分成数组。第一个参数是分隔符, 第二个参数是被分隔的字符串, 返回值是被切分出来的数组。
这里我们使用空分隔符, 也就是会将每个字符单独分割出来成为单独的元素。这样@strs数组中的每个元素, 都是单个的字符。
接下来, 我们遍历整个@strs数组, 统计每个字符
++是自增运算符, 作用是+1, 也就是下面2个方式是等效的:
$hash{$char}++
这行代码中,其实我们将所有的统计逻辑都写在的里面
下面我们用更啰嗦的方式看下这行代码的具体内容:
上面这几行代码和$hash{$char}++是等效的。
为什么我们可以不判断就直接自增呢?
我们具体根据if成立和不成立2种情况来看,
- 当if成立时, 也就是当前这个字符串作为key在我们的散列%hash中存在的, 那也就是说, 这个字符至少出现了一次。这个时候我们直接+1是没有问题的, 同时也将该字符这次出现统计了进去
- 当if不成立时, 也就是当前这个字符串作为key在我们的散列%hash中不存在, 那也就是说, 这个字符是第一次出现, 那我们应该给他赋值1(就像我们上面的else中的代码一样)。那为什么我们直接自增也可以呢?因为在Perl中, 当数据不存在(也就是undef)时, 在标量环境(记住, 一定是在标量环境下)下进行数字运算, 这个数据会被当作0来进行处理, 也就是说我们自增的时候相当于 0 + 1, 这样就等于直接赋值1了。
当我们遍历完整个数组时, 我们已经知道所有字符出现的次数了。下面我们将结果排序, 再打印出来:
sort也是系统内置函数, 作用是用来排序, 花括号里面的内容为排序的规则(这边的意思是根据数字大小反向排序, 具体sort的用法以后详细说)。
这边我们使用sort将散列中的数据, 根据value的值, 从大到小排列以后, 再依次输出:
统计数据次数, 是Perl中使用散列数据唯一性这个特性比较常见, 也是比较高效的功能。
Perl基础——标量
一些常用的计算机语言为各种不同类型的数值提供了不同的数据类型,许多种类往往容易混淆。 而perl不同, Perl只提供了少数几种内置的数据类型。
Perl有三种基础数据类型:标量, 标量数组(简称数组), 标量散列(简称散列)。
这里我们先从最基础的类型—标量开始。
标量是所有数据类型的基础, 标量通常存储单一的简单值, 往往就是一个字符串或者一个数字。
标量在Perl中的前缀符号是$.
在Perl中, 所有的数据类型, 不管是字符串, 整数, 浮点数等等, 都是一样定义以及存储的, 不需要特别的区分:
Perl会自动根据数据内容来确认具体的类型。
相应的, 在不同类型的数据之间进行相加等运算时, 也不需要对数据进行特殊的转义等操作, perl会自动来处理。
比如
整数和浮点数相加:
字符串和数字连接(用.而不是+)
$result1 将自动变为浮点数, $result2将自动变成字符串
常量
在标量数据类型中, 有一种特别的标量—常量。 常量表示这个值只赋值一次, 以后再也不再, 也不允许变更其值。
Perl标准模块内值的常量方式为use constant
比如
当我们尝试再次改变一个常量的值时, 程序会报错:
然而这种方式使用裸字(没有标识符)来命名, 以及赋值的缺陷性(仅在预编译时赋值), 在很多场合并不好用(具体这里不展开了, 以后单独写)。更推荐的常量方法是使用Readonly模块:
最佳实践:标量的命名
为了保持代码的可读性以及可维护性,在编写代码时,我们需要尽量保证统一的命名标准。
这里介绍比较常用的命名标准。
变量名字均使用小写, 多个单词使用_连接, 标量使用单数单词:
布尔型标量根据测试命名:
常量均使用大写, 其他参照变量。
本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com
文章为作者独立观点不代本网立场,未经允许不得转载。