习题 15: 读取文件 ************************** 你已经学过了 ``raw_input`` 和 ``argv``\,这些是你开始学习读取文件的必备基础。你\ 可能需要多多实验才能明白它的工作原理,所以你要细心做练习,并且仔细检查结果。处理\ 文件需要非常仔细,如果不仔细的话,你可能会吧有用的文件弄坏或者清空。导致前功尽弃。 这节练习涉及到写两个文件。一个正常的 ``ex15.py`` 文件,另外一个是 ``ex15_sample.txt``\,\ 第二个文件并不是脚本,而是供你的脚本读取的文本文件。以下是后者的内容: .. literalinclude:: ex/ex15_sample.txt 我们要做的是把该文件用我们的脚本“打开(open)”,然后打印出来。然而把文件名\ ``ex15_sample.txt`` 写死(hardcode)在代码中不是一个好主意,这些信息应该是用户\ 输入的才对。如果我们碰到其他文件要处理,写死的文件名就会给你带来麻烦了。我们的\ 解决方案是使用 ``argv`` 和 ``raw_input`` 来从用户获取信息,从而知道哪些文件该\ 被处理。 .. literalinclude:: ex/ex15.py :linenos: 这个脚本中有一些新奇的玩意,我们来快速地过一遍: 代码的 1-3 行使用 ``argv`` 来获取文件名,这个你应该已经熟悉了。接下来第 5 行我\ 们看到 ``open`` 这个新命令。现在请在命令行运行 ``pydoc open`` 来读读它的说明。\ 你可以看到它和你自己的脚本、或者 ``raw_input`` 命令类似,它会接受一个参数,并\ 且返回一个值,你可以将这个值赋予一个变量。这就是你打开文件的过程。 第 7 行我们打印了一小行,但在第 8 行我们看到了新奇的东西。我们在 ``txt`` 上调\ 用了一个函数。你从 open 获得的东西是一个 ``file`` (文件),文件本身也支持一些\ 命令。它接受命令的方式是使用句点 ``.`` (英文称作 dot 或者 period),紧跟着你的\ 命令,然后是类似 ``open`` 和 ``raw_input`` 一样的参数。不同点是:当你说 ``txt.read`` 时,你的意思其实是:“嘿 txt!执行你的 read 命令,无需任何参数!” 脚本剩下的部分基本差不多,不过我就把剩下的分析作为加分习题留给你自己了。 你应该看到的结果 =================== 我的脚本叫 "ex15_sample.txt",以下是执行结果: .. literalinclude:: ex/ex15.txt :language: console 加分习题 ============ 这节的难度跨越有点大,所以你要尽量做好这节加分习题,然后再继续后面的章节。 1. 在每一行的上面用注解说明这一行的用途。 2. 如果你不确定答案,就问别人,或者上网搜索。大部分时候,只要搜索 "python" 加上\ 你要搜的东西就能得到你要的答案。比如搜索一下“python open”。 3. 我使用了“命令”这个词,不过实际上它们的名字是“函数(function)”和“方法(method)。\ 上网搜索一下这两者的意义和区别。看不明白也没关系,迷失在别的程序员的知识海洋\ 里是很正常的一件事情。 4. 删掉 10-15 行使用到 ``raw_input`` 的部分,再运行一遍脚本。 5. 只是用 ``raw_input`` 写这个脚本,想想那种得到文件名称的方法更好,以及为什么。 6. 运行 ``pydoc file`` 向下滚动直到看见 ``read()`` 命令(函数/方法)。看到很多\ 别的命令了吧,你可以找几条试试看。不需要看那些包含 ``__`` (两个下划线)的\ 命令,这些只是垃圾而已。 7. 再次运行 ``python`` 在命令行下使用 ``open`` 打开一个文件,这种 open 和 read 的方法也值得你一学。 8. 让你的脚本针对 ``txt`` and ``txt_again`` 变量执行一下 ``close()`` ,处理完\ 文件后你需要将其关闭,这是很重要的一点。 常见问题回答 ========================== ``txt = open(filename)`` 返回的是文件的内容吗? 不是,它返回的是一个叫做“file object”的东西,你可以把它想象成一个磁带机或者DVD机。你 可以随意访问内容的任意位置,并且去读取这些内容,不过这个 object 本身并不是它的内容。 我没法再我的 Terminal/PowerShell 命令行下输入 python 代码。 首先,在命令行输入 ``python`` 然后敲回车。现在你就在 python 环境中了。接下来你就可以\ 输入并运行一句一句的代码。试着玩玩,如果想退出就输入 ``quit()`` 再敲回车。 ``from sys import argv`` 是什么意思? 现在能告诉你的是, ``sys`` 是一个代码库,这句话的意思是从库里取出 ``argv`` 这个功能来,\ 供我使用。后面你会学到更多相关知识。 我把文件名写进去写成 ``script, ex15_sample.txt = argv`` 不过这样不灵。 这么做是错的。把代码写成和我一模一样,然后从命令行运行,照着我的方式。你不需要把文件名放到\ 代码中,而是让 Python 把文件名当做参数接纳进去。 为什么打开了两次文件没有报错? Python 不会限制你打开文件的次数,事实上有时候多次打开同一个文件是一件必须的事情。