中文标题相似度检测
前言 对中文标题使用余弦相似度算法和编辑距离相似度分析进行相似度分析。 准备数据集part1 本次使用的数据集来源于前几年的硕士学位论文,可根据实际需要更换。结构如下所示: 学位论文题名 基于卷积神经网络的人脸识别研究 P2P流媒体视频点播系统设计和研究 校园网安全体系的设计与实现 无线传感器网络中 ...
Python多任务教程
一.并发和并行 多任务:一定时间段内,充分利用cpu资源,同时去执行多个任务 并发: 快速交替的 去执行多任务 并行: 真正同时的 去执行多任务 ,就是同时进行 二.多进程 1.多进程入门 知识点: 进程含义: 运行中的程序 进程特点: cpu资源分配的 最小单位 多进程模块: multiproce ...
Python常见面试题001-005,涉及深浅拷贝、MRO、函数可变参数、作用域、is和==的区别等
Python常见面试题001-005 参考资料 https://github.com/taizilongxu/interview_python https://github.com/hantmac/Python-Interview-Customs-Collection https://github. ...
python爬虫学习——元组,字典(2.14日博客补)
元组 ''' tup1 = () #创建一个空的元组 print(type(tup1)) #tup2 = (50) #不是元组,python把括号当成了表达式的一部分,即数学运算的括号 #tup2 = (50,) tup2 = (50,60,70) print(type(tup2)) ''' ''' ...
Python实现随机森林RF并对比自变量的重要性
本文介绍在Python环境中,实现随机森林(Random Forest,RF)回归与各自变量重要性分析与排序的过程。 其中,关于基于MATLAB实现同样过程的代码与实战,大家可以点击查看MATLAB实现随机森林(RF)回归与自变量影响程度分析这篇文章。 本文分为两部分,第一部分为代码的分段讲解,第二 ...
Python 内置界面开发框架 Tkinter入门篇 丁
最终季来了,快来追更!这篇文章属于系列文章《Python 内置界面开发框架 Tkinter入门篇》的第四篇,也是最后一篇了。 ...
1.8 习题
我们来看一下第一章的习题: 操作符:*,-,/,+; 值:5,'hello',-1.88,5 spam是变量,'spam'是字符串 整形、浮点型、字符串 表达式由值和操作符组成,所有的表达式都是用来求值的 表达式有操作符和值 bacon = 20 'spamspamspam' egg符合变量名命名规 ...
多级缓存降低高并发压力
多级缓存就是充分利用请求处理的每个环节,分别添加缓存,减轻Tomcat压力,提升服务性能: 浏览器访问静态资源时,优先读取浏览器本地缓存。在多级缓存架构中,Nginx内部需要编写本地缓存查询、Redis查询、Tomcat查询的业务逻辑,因此这样的nginx服务不再是一个反向代理服务器,而是一个编写业... ...
Python实现类别变量的独热编码(One-hot Encoding)
本文介绍基于Python下OneHotEncoder与pd.get_dummies两种方法,实现机器学习中最优的编码方法——独热编码的方法~ ...
【爬虫+数据清洗+可视化分析】舆情分析哔哩哔哩"狂飙"的评论
python爬取并可视化分析哔哩哔哩关于"狂飙"的上千条评论数据。
一、爬虫
requests 发送请求
json 解析接口数据
pandas 保存csv文件
二、可视化分析
IP属地分析-柱形图
评论时间分析-折线图
点赞数分布-直方图
评论内容-情感分布饼图
评论内容-词云图
并分析得出一系列相... ...
下载某乎专栏文章并存为markdown
前言 由于在2月13日,Autojs的作者发出公告将审查所有代码,并在最新版删除了无障碍截图、通知监听等功能,在打开所有版本都会提示强制更新,之前关注的公众号都连夜删除了教程文章,在搜索时,发现教程作者的文章在其它平台还未删除,为了保险起见,备份一下他的文章。由于他写的文章很多,文章将通过爬虫的方式 ...
什么是Python装饰器?
装饰器是Python中非常重要的一个概念,如果你会Python的基本语法,你可以写出能够跑通的代码,但是如果你想写出高效、简洁的代码,我认为离不开这些高级用法,当然也包括本文要讲解的装饰器,就如同前面提到的代码调试神器PySnooper一样,它就是主要通过装饰器调用的方式对Python代码进行调试。 ...