最近,我尝试了John Crickett的编码挑战,并决定分享我的经验。第一个挑战是使用PHP重写经典的Unix工具wc(单词计数器)。虽然我自1997年以来就一直使用Linux,但wc并非我常用的工具,因此我决定深入研究一下。
我最初的想法是用文本编辑器直接编写代码,使用Vim在SSH连接下,平板电脑作为终端,甚至不使用键盘。我选择了PHP作为我的开发语言,认为这应该很简单。结果证明,这是一个糟糕的主意,代码混乱不堪,我将其保留在GitHub仓库中作为警示。
在添加蓝牙键盘并将Vim配置成更像IDE之后,我进行了第二次尝试。这次,我的目标是:
以下是我的主要收获:
立即学习“PHP免费学习笔记(深入)”;
挑战与解决方案:
多字节字符支持: 一个成熟的Unix工具理应支持多字节字符。PHP的mb_strlen函数解决了这个问题。
大文件支持: wc可能需要处理超过系统内存的文件。我需要分块读取文件,避免使用file_get_contents。 处理跨越块边界的单词也需要特殊考虑。
标准输入: 程序需要能够从标准输入(管道和重定向)读取数据。这需要使用流处理。
开发环境的重要性:
我放弃了平时使用的PHPStorm,转而使用一个简单的文本编辑器。这让我意识到IDE提供的自动化功能以及我对此的依赖程度。我尤其怀念代码补全和重构工具。
缺乏重构工具显著增加了我的认知负担,使编程过程变得笨拙。我不得不记住PHP内置函数的参数顺序以及自己代码的结构。这降低了我的开发速度。
我发现缺乏重构工具阻碍了迭代开发。进行代码结构调整变得非常费力,我经常选择保留最初的错误设计,而不是进行修改。
建议:
在第二次尝试中,我进行了大量的测试驱动开发,这极大地提高了我的开发速度和信心。
代码示例:
我最初的count方法:
if ($countmode === countmode::character) { return strlen($contents); } // ... other cases ...
改进后的count方法,使用匹配表达式:
return match($countMode) { CountMode::CHARACTER => strlen($contents), CountMode::MB_CHARACTER => mb_strlen($contents), CountMode::LINE => count(preg_split('(\r\n|\r|\n)', $contents)) - 1, CountMode::WORD => static::countWords($contents) };
其他收获:
总而言之,这是一个很有挑战性的经历,让我学到了很多东西。我的完整解决方案已上传至GitHub。
以上就是我在php中建造了`wc'的详细内容,更多请关注php中文网其它相关文章!
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号