当前位置: 首页 > news >正文

网站项目接单国外产品网站

网站项目接单,国外产品网站,网页设计模板网站图片,海南在线 海南一家转自:https://www.ibm.com/developerworks/cn/java/l-java-tips/ 感谢作者发布的文章用 jacob其实 jacob 是一个 bridage#xff0c;连接 java 和 com 或者 win32 函数的一个中间件#xff0c;jacob 并不能直接抽取 word,excel 等文件#xff0c;需要自己写 dll 哦…转自:https://www.ibm.com/developerworks/cn/java/l-java-tips/     感谢作者发布的文章用 jacob其实 jacob 是一个 bridage连接 java 和 com 或者 win32 函数的一个中间件jacob 并不能直接抽取 word,excel 等文件需要自己写 dll 哦不过已经有为你写好的了就是 jacob 的作者一并提供了。下载了 jacob 并放到指定的路径之后 (dll 放到 path,jar 文件放到 classpath)就可以写你自己的抽取程序了下面是一个简单的例子importjava.io.File;import com.jacob.com.*;import com.jacob.activeX.*;/*** Title: pdf extraction* Description: email:chrismatrix.org.cn* Copyright: Matrix Copyright (c) 2003* Company: Matrix.org.cn*authorchris*version1.0,who use this example pls remain the declare*/public classFileExtracter{public static voidmain(String[] args) {ActiveXComponent component new ActiveXComponent(Word.Application);String inFile c:\\test.doc;String tpFile c:\\temp.htm;String otFile c:\\temp.xml;boolean flag false;try{component.setProperty(Visible, new Variant(false));Object wordacc component.getProperty(document ).toDispatch();Object wordfile Dispatch.invoke(wordacc,Open, Dispatch.Method,new Object[]{inFile,new Variant(false), new Variant(true)},new int[1] ).toDispatch();Dispatch.invoke(wordfile,SaveAs, Dispatch.Method,new Object[]{tpFile,new Variant(8)}, new int[1]);Variant f new Variant(false);Dispatch.call(wordfile,Close, f);flag true;}catch(Exception e) {e.printStackTrace();}finally{component.invoke(Quit, newVariant[] {});}}}用 apache 的 poi 来抽取 wordexcel。poi 是 apache 的一个项目不过就算用 poi 你可能都觉得很烦不过不要紧这里提供了更加简单的一个接口给你下载之后放到你的 classpath 就可以了下面是如何使用它的一个例子import java.io.*;import org.textmining.text.extraction.WordExtractor;/*** Title: word extraction* Description: email:chrismatrix.org.cn* Copyright: Matrix Copyright (c) 2003* Company: Matrix.org.cn* author chris* version 1.0,who use this example pls remain the declare*/public class PdfExtractor {public PdfExtractor() {}public static void main(String args[]) throws Exception{FileInputStream in new FileInputStream (c:\\a.doc);WordExtractor extractor new WordExtractor();String str extractor.extractText(in);System.out.println(the result length isstr.length());System.out.println(the result isstr);}}pdfbox- 用来抽取 pdf 文件下面是一个如何使用 pdfbox 抽取 pdf 文件的例子importorg.pdfbox.pdmodel.PDdocument importorg.pdfbox.pdfparser.PDFParser;import java.io.*;importorg.pdfbox.util.PDFTextStripper;importjava.util.Date;/*** Title: pdf extraction* Description: email:chrismatrix.org.cn* Copyright: Matrix Copyright (c) 2003* Company: Matrix.org.cn*authorchris*version1.0,who use this example pls remain the declare*/public classPdfExtracter{publicPdfExtracter(){}public String GetTextFromPdf(String filename) throwsException{String tempnull;PDdocument nbsppdfdocument null;FileInputStream isnewFileInputStream(filename);PDFParser parser newPDFParser( is );parser.parse();pdfdocument nbspparser.getPDdocument );ByteArrayOutputStream out newByteArrayOutputStream();OutputStreamWriter writer newOutputStreamWriter( out );PDFTextStripper stripper newPDFTextStripper();stripper.writeText(pdfdocument getdocument ), writer );writer.close();byte[] contents out.toByteArray();String tsnewString(contents);System.out.println(the string length iscontents.length\n);returnts;}public static voidmain(String args[]){PdfExtracter pfnewPdfExtracter();PDdocument nbsppdfdocument nbsp null;try{String tspf.GetTextFromPdf(c:\\a.pdf);System.out.println(ts);}catch(Exception e){e.printStackTrace();}}}抽取支持中文的 pdf 文件xpdfxpdf 是一个开源项目我们可以调用他的本地方法来实现抽取中文 pdf 文件。按照 readme 放好中文的 patch就可以开始写调用本地方法的 java 程序了下面是一个如何调用的例子import java.io.*;/*** Title: pdf extraction* Description: email:chrismatrix.org.cn* Copyright: Matrix Copyright (c) 2003* Company: Matrix.org.cn*authorchris*version1.0,who use this example pls remain the declare*/public classPdfWin {publicPdfWin() {}public static void main(String args[]) throwsException{String PATH_TO_XPDFC:\\Program Files\\xpdf\\pdftotext.exe;String filenamec:\\a.pdf;String[] cmd new String[] { PATH_TO_XPDF, -enc, UTF-8, -q, filename, -};Process pRuntime.getRuntime().exec(cmd);BufferedInputStream bis newBufferedInputStream(p.getInputStream());InputStreamReader reader new InputStreamReader(bis, UTF-8);StringWriter out newStringWriter();char [] buf new char[10000];intlen;while((len reader.read(buf)) 0) {//out.write(buf, 0, len);System.out.println(the length islen);}reader.close();String tsnewString(buf);System.out.println(the str ists);}}
http://wiki.neutronadmin.com/news/242332/

相关文章:

  • 网站改版seo建议wordpress 添加 博文
  • 一个人网站运营怎么做开锁换锁做网站
  • 最好的网站建设系统济南网站建设有限公司
  • 商务网站建设实验书网站建设是什么专业啊
  • 秦皇岛网站建设系统推荐桦甸网站建设
  • 男女做视频观看网站wordpress教程文档下载
  • 软件开发培训机构找极客时间西安优化网站公司
  • 淘宝做网站的都是模板万城建设网站
  • 网站开发获取用户微信号登录做商城外贸网站
  • 如何通过网站后台修改网站电商网站设计规范
  • 管理网站 开发黔西南做网站的有几家
  • 浙江省建设厅 网站是多少怎么看网站开发的发展
  • 网站备案时间也太慢了百度云搜索引擎入口百度网盘
  • 阿里云有主体新增网站简历网站有哪些
  • 用js做网站登录北京数据优化公司
  • 贵阳网站建设三思网络长春建设网站公司哪家好
  • 学信网 的企业网站给你做认证湘阴网站建设
  • 织梦做有网站有后台 能下载备份所有代码文件么哪个网站企业邮箱最好
  • 做头像的网站空白桂林人才网
  • 如何建视频网站软文代写是什么
  • 行知智网站开发精准广告投放
  • 自己做的微课上传到哪个网站专业的临沂网站优化
  • 企业一站式网站建设做免费网站教程国vs
  • 自己做服务器的网站吗xml网站地图每天更新
  • 做网站怎么字体全部变粗了设计培训班大概多少钱
  • 网站开发如何让图片加载的更快福田做棋牌网站建设找哪家效益快
  • 织梦网站如何做伪静态wordpress增加内存
  • 杭州模板网站wordpress视频大小自由适配屏幕
  • 佛山网站建设公司排行丹东有做公司网站的吗
  • 曹县商城网站建设云主机添加网站