Beautiful Soup(HTML/XML解析工具) V4.3.2

　　Beautiful Soup是款专门针对python推出的HTML/XML解析工具。它具有强大的解析功能，可以方便的处理不规范标记并生成剖析树，自动将输入文档转换成Unicode编码，适用于抓取网站数据，大大提高工作效率。

HTML/XML解析工具使用方法

　　1、解压文件

　　将下载得到的压缩包解压到任意文件夹，路径不含中文

　　2、打开cmd命令提示符

　　win+r，输入cmd，回车

　　进入解压后的目录，我这里是C：\Python27\bs4\beautifulsoup4-4.3.2

　　所以使用

　　cd C：\Python27\bs4\beautifulsoup4-4.3.2

　　然后

　　setup.py build

　　接着

　　setup.py install

　　完成安装

　　3、测试

　　python

　　import bs4

　　没有提示错误，成功！

HTML/XML解析工具特色

　　1、Beautiful Soup提供了一些简单的方法和Python术语，用于检索和修改语法树：一个用于解析文档并提取相关信息的工具包。这样你写一个应用不需要写很多代码。

　　2、Beautiful Soup自动将输入文档转换为Unicode编码，并将输出文档转化为UTF-8编码。你不需要考虑编码，除非输入文档没有指出其编码并且Beautiful Soup无法自动检测到，这时你需要指出原来的编码方式。

　　3、Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上层，这允许你使用不同的解析策略或者牺牲速度来换取灵活性。

人气下载