Archives

Posts Tagged ‘python’

这两天突发奇想觉得python脚本语言很简单,很实用,就一头扎入其中玩了几天,全然不顾还有一堆的工作等待我去crack。想起某人的话:“职业人与学生最大的差别在于兴趣的时候,是服从任务调遣还是内心。职业人只要有任务在身,deadline一旦设定就要努力向前,争取如期完成任务。而学生喜欢懒懒散散,尤其以兴趣来了为借口,东一榔头,西一榔头的瞎忙活,结果工期总是一推再推,比预计要花出多几倍的时间”。我目前就缺乏这种职业精神,原来做好的计划在变化和所谓兴趣面前烟消云散了。
在这里记录一下关于python试水的心得和过程。一方面是python试水手记,另一方面由于自己失误,犯了个大错误,因此这篇blog这也是对自己的一个提醒:因为在开始一个程序调试之前,很重要的一个因素:外部接口的支持程度,没有考虑到,导致瞎忙活了一天多时间,最后还没完成原始目标。
这两天在浏览时发现一个问题,有些pdf电子书没有做bookmark,不容易定位章节。网上有一个成熟的软件PdfBookmark可以根据一个xml文件生成pdf的书签。我就萌生用python写个脚本生成相应xml从而生成自己想要的书签的想法。
以后浏览书籍的过程是这样:
1. 浏览pdf书籍,手动记录章节和页码信息在一个excel或者txt文件中。
2. 用python读取这个简单的txt文件并按照规则生成PdfBookmark所需xml
3.用此xml更新pdf文件的bookmark
很简单的任务和目标,可惜自己之前没有调研软件PdfBookmark是否支持中文书签,实验了它的英文example,觉得很不错,就赶紧动手了。下面是整个实验试水的一个记录。
 
Setuptools 和 easyInstall的关系?
CPAN PyPI distutils eggs package management
setuptools是对python的package Index进行管理的工具,python工具包的后缀名都是.egg,需要专门的工具进行安装:easyInstall。
.egg 是windows平台上的二进制文件,可以直接被程序easyInstall调用。
目前的setuptools只能支持到python 2.6版本,而python3.1的setuptools没有官方版本。有网友开发出了可兼容python3的setuptools. http://regebro.wordpress.com/2009/02/01/setuptools-and-easy_install-for-python-3/
文章同时指出,当前支持3.1的python库还不多。不过距离当时发表时间已经过去1年了,不知目前的python 3.1的package库支持能力如何,应该有极大的提高和长进。就在1月4号,pyhon官方发布了最新的一批文档,更新频率还是挺快的。
 
lxm包的安装
1. 去http://codespeak.net/lxml/ ,下载lxml包。最新版本2.2.4,09年11月11日发布。
2. 然后根据instruction进行安装:http://codespeak.net/lxml/installation.html
3. 在此之前有两个依赖包。先不管。
4. 获取工具(也是基于python的一个功能模块)easy_install(Easy Install is a python module (easy_install) bundled with setuptools that lets you automatically download, build, install, and manage Python packages.)windows平台上,Pyhon 2.6版本会之间附带上easy_install.exe,但在3.1版本安装目录下,没有这个安装文件。而且,pyhon3.1没有easy_install工具。那么3.1如何安装更新包呢? 不解。
找到一封邮件回复说明python3.1暂不支持lxml,我就不想再花费时间去找新的工具解决这个big problem了。
Dov Reshef wrote:
> I’m trying to install lxml 2.2.2 for python 3.1. (I’m [...]

Jan 7th, 2010 | Filed under 相关技术