maccman/juggernaut

maccman/juggernautUsing Juggernaut from Python You don't have to use Ruby to communicate with Ju

webclassify 用于网页分类的python工具包

本工具包将一些常用的网页分类不同语言的相关开源软件,如ictclas,BeautifulSoup,libsvm等进行封装组合,以方便用python进行网页分类相关程序的开发。# uitl:一些常用的开

MyProject / FuzzyPages | Elias的个人主页

MyProject / FuzzyPages | Elias的个人主页Fuzzy Pages我使用本脚本处理httrack程序下载的phpbb2论坛页面,对下载页面中的冗余部分进行去除和合并,以达到减