PHP读取word文档 导入word文档
- PHP读取word文档 导入word文档
- libreoffice把word转html
- 用phpquery读取html的内容
PHP读取word文档 导入word文档
前一段时间在工作中遇见了一个棘手的需求,客户要求把word里的数据导入,对数据进行统计。
刚开始觉得挺简单用phpword应该能够实现,后在网上各处询问也没发现phpword能够导入word,
然后我就转换了思路,先用libreoffice把word转换成html
libreoffice把word转html
安装libreoffice就不多做介绍
用这个命令就可以把word文档转为html
用phpquery读取html的内容
获取到html了下面就是读取里边的内容了 大家应该都用过jquery,jQuery可以在html中获取html里的内容
可以在php后端我们改如何操作呢,用phpQuery就可以让php处理html代码像jQuery一样方便。
项目地址:https://code.google.com/p/phpquery/
github地址:https://github.com/TobiaszCudnik/phpquery
DEMO
下载库文件:https://code.google.com/p/phpquery/downloads/list
我下的是onefile版:phpQuery-0.9.5.386-onefile.zip
官方demo:https://code.google.com/p/phpquery/source/browse/branches/dev/demo.php
然后在项目中引用。
phpquery的文档特别少,但是和jquery的差别并不大
pq($param, $context = null);
pq(); 相当于 jQuery的$();。它主要完成三件事情:
- 载入标记资源:
// 输入到载入的文档:
// 对于最开始输入的字符串不接收文本类型的节点:pq(’
// 从$pq->getDocumentID()根据ID载入到文档: pq(’
// 根据DOM节点的归属将同样的文档载入:pq(’
// 从phpQuery 对象载入文档: pq(’
- 运行查询
// 根据最后一个选择的文档执行查询:pq(‘div.myClass’)
// 根据$pq->getDocumentID()的ID从文档中进行查询:pq(‘div.myClass’, $pq->getDocumentID())
// 在同样的文档上根据DOM节点的归属进行查询并且使用节点作为查询的根节点:pq(‘div.myClass’, DOMNode)
// 在文档上使用phpQuery对象进行查询
// 同时使用对象的栈作为根节点进行查询: pq(‘div.myClass’, $pq)
- 使用phpQuery对象对DOM节点进行原型化操作
foreach(pq(‘li’) as $li) // $ li是纯DOM节点, 将它变为phpQuery对象: pq($li);。
原创文章,码字不易,转载请注明出处