`
goofyan
  • 浏览: 14636 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
粗略看了点ansj源代码,记录备忘。   词典等配置文件加载类(以调用NlpAnalysis分词类为例): 1,  MyStaticValue 初始化NlpAnalysis中static的静态变量splitword时调用了MyStaticValue类,该类中几乎所有变化、方法均是静态的。包括以ResourceBundle.getBundle("library")获取library.properties配置文件,读取用户词典路径、歧义词典路径、是否用户辞典不加载相同的词isSkipUserDefine、isRealName。并读取resources目录下的compa ...

struts理解

    找工作的时候老是会被问java框架熟悉吗,用哪个框架等等。表示我没用到过,趁现在闲着来粗粗学习下。     struts源码重要的两个部分是core和xwork-core,前者依赖后者。使用struts有两个配置文件很重要,struts.xml和web-inf/web.xml。struts.xml配置struts的package/action等。org.apache.struts2.config.StrutsXmlConfigurationProvider读struts.xml,解析,加载各个package、constant等。web.xml中配置filter过滤器(FilterDisp ...
    thrift是个跨语言的远程过程调用(RPC)服务,支持client和server以多种语言通讯。     可以在源代码lib/java中获得jar包。代码、接口示例可参考thrift源代码中的tutorial/tutorial.thrift,tutorial/java。使用:     一、定义接口IDL:xxx.thrift。支持的数据类型有:bool;byte: 有符号字节;i16: 16位有符号整型;i32: 32位有符号整型;i64: 64位有符号整型;double: 64位浮点型;string。其他类型有list、set、map、struct、exception、enum等。包 ...
转载自http://hi.baidu.com/i1see1you/item/783a701f39a87549e75e06ea 1.Mongodb bson文档型数据库,整个数据都存在磁盘中,hbase是列式数据库,集群部署时每个familycolumn保存在单独的hdfs文件中。 2.Mongodb 主键是“_id”,主键上面可以不建索引,记录插 ...
    解析pdf的java开源包有itext、pdfbox、xpdf等。据说pdfbox对中文支持不好,xpdf是用命令行调用,还一堆七七八八的配置,没用过。itext一般来说是生成pdf比较容易,解析比较麻烦,效果感觉还是可以的。但是。     标准pdf文件是根据pdf规范设计的。pdf文件中的文字、页面、页眉页脚、图、线等都是一个个对象。总的来说就是一个pdf对应一个文档,文档中有若干页,每页中有各自所包含的对象,比如说行,也比如说行中的文本。     对象可以由操作符推断出,操作符后面紧跟该操作符所需的若干个操作数。一类很重要的操作数是位置坐标。itext返回的数据流顺序不一定是我们眼 ...

junit几点

junit.framework与org.juint. 1.对testcase,junit.framework是junit3的写法,org.unit是junit4的写法。 2.junit.framework。测试类继承自TestCase,函数名固定setUp()、tearDown()、testXXXX()....org.unit,@Before、@After、@Test junit.framework,TestRunner类,主类。接受TestCase的类名为参数。两种方式,若有static suite(),执行全部test;否则执行所有"test"开头、不含参数的方法。 3 ...
    java有很多解析html的开源包,有htmlparser、cobra、jsoup、html4j、htmlclean等,http://www.open-open.com/30.htm     项目中使用的是cobra,其他的没用过。cobra能解析javascript和css,项目中没有用这两项,也没研究过这块的代码。也是因为支持这些,如果不禁用,会占用相当大的内存,比如每个节点都会含有一个xxxStyle的对象。cobra的源码相当大,构造document的基本思路是顺序读页面数据,找tag的开始<和结束>符,在结束符前碰到的所有标签、文本都加为子节点。cobra不支持纠错 ...

jdk安装

    发现电脑上木有jdk/jre了,重新下了个jdk。     第一次仔细看jdk的安装过程,开发工具+源代码+独立运行的jre     以前也不曾好好看过安装过后都有些什么,也纠结过为什么明明只装了1次jdk,会有多个jre呢?是不是装其他软件的时候被安装的....     其实安装jdk是会装两个jre的,一个在jdk目录下,一个在其他地址,默认C盘,是jdk本身java程序运行的jre环境。哪到底默认用哪个?一般是C盘那个。     只装了jre能写java程序吗?不能。jre只是个运行环境,就是说你如果写好了程序编译成了.class文件,那只要有jre就能运行。但是需要jdk这个开发 ...
Global site tag (gtag.js) - Google Analytics