阅前须知由于该网站太顶风作案,域名我和谐了,懂的自然懂我还在学 py,代码过于辣鸡甚至没有优化,调用方法完全乱套背景由于用公司研发部同事基于 Java 开发的某网站查询的爬虫用得太爽了,搞到我自己都想抄一份试试了,并在此之前通过百度“抄了”很多方法做了个多线程查询接口的小程序就有点膨胀了(其实代码还是一坨屎,而不需要太多字符串处理)同事做的虽然速度很快,还特意为验证码做了训练识别率超高也很快,后来我反编译同事的源码发现用了阿里云的 OCR 服务,爷懂了,这就是在线识别的速度吗,爷i了(然后今天用回同事的工具发现他的API终于炸了,不能开心的批量.....

阅读全文...

在公司某个平台升级后,导出数据再也不能用 navicat 导出了,毕竟厂商都换成 Elasticsearch 数据库,我懂个屁,那就只能老实用平台自带的导出功能实现每周导出需求。可是啊,他们设定的导出只能单文件导出60000行,导致50W的内容都要拆分几十个文件。在初期我是用 WPS 批量合并表格,再删除重复项,再继续合并(Excel 有最大行数限制),光是把所有节点的内容导出了都要用40分钟,实在是太没效率了。没有办法,只有自动化才能解放效率,然后我就开始抄网上的代码实现关于 python 表格的内容了。代码这是整合在一起的乐色代码,写得很烂.....

阅读全文...

最近应领导要求,给我司的某些设备都上了 Zabbix 监控,意思就是以后再出问题都不能赖厂商了,有事都把锅丢给我,爷佛了,被前同事不断套路下去,接了这个粪坑。弄了之后观察了一个月,某台信息设备的工作效率确实负载一高后,任务的执行效率就会失效,只有等到负载低了工作才正常,怎么办如果拖住又出问题了又tm甩锅给我背,那肯定没办法啊。问了厂商的主要对接人,他说某个应用怎么只跑了一个核,没办法将 CPU 的负载压下去啊。这样的话爷tm岂不是要凉了?先试了下重启大法看看有没有问题,重启后,过了十几分钟负载还是突然上去了,看了 top 都跑了 23.00 了.....

阅读全文...

RH124 Day 2-3

October 27, 2019
由于培训,所以也整理一份文档以便日后复习。该文章将会根据我的学习进程不断更新,暂时不会另开一篇文章用户管理root 的权限很大,可以接近完全控制整个操作系统,规则不受限。一般情况下用普通用户进行操作,到需要提权的命令就使用 sudo 。Linux 文件系统文件结构Linux 的文件结构为 单根倒树状(头上是根,下面是枝与叶)- 如何理解单根倒树状,就像整个树木的结构倒过来, 最顶部为根(/), 根下面就是枝(/etc、/home、/var), 枝下面就是叶(文件名), /root/1.txt 的根是 /,枝为 /root/ ,叶就是 1.txt.....

阅读全文...

其实最快的方法就是弄 Docker,所以这是快速版搭建我在公司做的是网络监控,主要是不同运营商的节点对不同省份地区的进行监测,评价网络质量主要是时延和丢包率,但我们不可能用 Ping -t 一直测,我也不知以前的同事为什么可以把用于服务器监控的 Zabbix 改造成只监测网络,所以我就把目前公司这个网络质量监测为基础,我的大学毕业论文就是写这个相关的。背景随着业务量的增多,根据领导或其他部门的同事的需求,我们也会对新的运营商出口搭建一个节点,主要是利用 Zabbix 的 “简单检查” 的功能,可以用 Zabbix-Proxy 对远程 IP 进行.....

阅读全文...