数据处理简介
简介 | 生产流程 | 生产线介绍
服务项目
应用实例
在线演示
 

通信地址:
北京亦庄运成街甲六号中献拓方公司208室(邮编100176)

电 话:
010-67889166
分机8401(胡新华)
分机8404(何家旻、李宣宣)

 

--国家知识产权局专利项目--

项目进展:中献拓方科技发展有限公司OCR生产线的前身是知识产权出版社于2000年开始研发投建的OCR生产线.2001年2月正式投入生产,到2003年6月完成了国家知识产权局自1985年以来所有的公开专利文献数据共1554210......
项目背景:国家知识产权局,原名中华人民共和国专利局(简称中国专利局)。......

---民国图书项目---

项目背景:2004年10月,中国图书馆学会高等学校图书馆分会成立。其成立大会在威海......

更多...

-人民出版社图书项目-


项目背景:2004年10月,中国图书馆学会高等学校图书馆分会成......
更多...

-黄河水利委员会项目-


项目背景:2004年10月,中国图书馆学会高等学校图书馆分会成立。其成立大会在威海市......

  同数字印刷一样,数据处理(亦称数字识别)技术是按需出版得以发展的的重要基础。 对于已经有印刷版的图书,在应用按需印刷再版时,需要数字化的图书内容。目前有三条获取途径:

  ① 简单的扫描,是将文档内容以图片形式扫入,相当于影印,该途径的长处在于忠实于原稿,不足之处在于不能进行检索,不能对文字进行识别,质量低下,不易修改和进一步加工,应用按需印制输出后与原版质量差距明显。

  ② 应用光学识别技术扫描、处理成可印刷的文件。应用该方式可以对文字进行识别,可以修改排版(相当于重新录入排版),易于修改和加工。

  ③ 重新录入 通过这种途径比较费时费力,出错的可能性较大。

  按需出版网依托北京中献拓方科技发展有限公司,可提供优质高效的数据处理业务。该公司拥有OCR光学字符识别系统和信息数字化的海量处理能力,可以实现从纸件文件到电子文本文件的转换,差错率可控制在万分之三以内。利用OCR系统可将各种类型(如纸制)文献代码化,形成XML等格式的数据。可处理中西文各种字体、横竖版各种版式,并可将科技文献中的数学式、化学式及表格等进行有效编码,进而建立数据库实现全文检索,还原复杂版式。该公司数字化产品质量高,准确性强;可进行快速、大量的纸制文档的代码化工作;是建设高级数据库、实施数字出版的基础。

 

生产现场图:


  OCR数据加工生产线核心是一个多核心OCR数据加工系统。该系统是2007年由拓方公司技术部自主开发。整个生产流程及工号管理由生产系统的服务器端管理,主要包括:数据库及数据文件的存储配置,多核心识别,工序设置,质量管理与监控,任务的分配及查看,返工包处理,产量的查询与统计,成品数据的导出及管理,员工工号、考勤及班次等管理。OCR数据加工生产线由拓方公司技术部作为技术支持,该部门现有14名技术支持人员,他们都有丰富的数据处理软件开发及使用经验。其中OCR系统软件开发人员8名,软件测试人员2名,设备及数据维护人员2名,OCR生产管理人员2名。这支专业技术支持队伍可使生产线的软件随时优化,问题......

更多...

---扫描---

  
  扫描在整个数字化流程中,具有举足轻重的地位,扫描质量的好坏直接影响到后续工作的质量。扫描文件也是进入数据库最原始的文件。各项目所涉及的书籍资料纸张质地状况可能情况不一,对图书的拆装要求也不同,为确保扫描顺利进行,应当选用纸张适应性优良的扫描设备并配合特定的扫描手段……
 

  
  修图采用图像处理软件进行加工处理。对扫描后形成的图像通过计算机自动处理和人工处理进行逐页纠偏、去污、去黑边、扫描精度、对比度、亮度调节、影像的替换、插入、删除、图像拼接、裁边处理、统一版面大小、排列顺序调整,还可对图像进行字迹锐化、去除图像杂点……
 

 OCR全称是光学字符识别技术(Optical Character Recognition,简称OCR),也就是文本代码化。中献拓方公司的OCR识别字符差错率可控制在万分之一以内。部分工序如下:识别(画框):该工序操作员在生产系统中下载工作包。画框时……

 

  OCR后的电子文件,采用中献拓方公司自主开发的软件恢复跟原书一样的版式,生成文字版本PDF文件,也可采用双重PDF技术还原版面同时代码化页面字符。  
   双层PDF技术是一种完全保存文献的方法,可以使原图书得到最大限度的保留。因该技术对原文献没有一点伤害,尤其适合历史文献的加工处理。它既可以进行全文检索,又可以看到原文图书。全文检索实际上是对OCR代码化加工后文字进行的检索,看到的原文图书其实是页面的扫描件,所以和原版面显示是一样的,却又能达到可以

www.cnbod.com
联系我们 | 网站地图 | 版权声明 | 信息量统计 | 网站支持单位 | 关于我们

网站维护:北京中献拓方科技发展有限公司
版权所有:北京中献拓方科技发展有限公司 未经许可不得复制
ICP备案编号:京ICP备05069088号