Python 操作图片识别,对比,验证码之PIL,pytesseract

安装python包 pip3 install pillow pip3 install pytesseract pytesseract的使用需要安装对应的Tesseract-OCR程序,无论是windows系统还是Lunix系统,都可以到GitHub下载相关版本。 链接:https://github.com/tesseract-ocr/tesseract/ 安装完成后,把你安装tesseract的路径添加到你电脑的环境变量path中, 或者修改pytesseract.py文件,指定tesseract.exe安装路径 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY tesseract_cmd = ‘C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe’ 或者在实际运行中指定路径 pytesseract.pytesseract.tesseract_cmd = ‘D:\\Program Files\\Tesseract-OCR\\tesseract.exe’ 读取图片里面文字: from PIL import Image import pytesseract img = Image.open(’test1.png’) text = pytesseract.image_to_string(img, lang=’eng’) print(text) image_to_string函式有一个关键字引数 lang,默认是英文,可以改变成你想要的语言字串 pytesseract.image_to_string(img, lang=’eng’,config=’–psm 11… Read More »

怎么从Chrome浏览器中导出扩展程序为crx文件?

1,首先找到Chrome的扩展文件目录: 默认位置未为: C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default\Extensions\ 也可以先找到chrome安装位置,再点“User Data”-“Default”–“Extensions”进入。 然后打开Chrome的’管理扩展程序’–>选择对应插件–>详细信息–> ID:   2,然后去Chrome扩展文件目录下,寻找对应此ID名字的目录: 3,再次进入Chrome扩展程序管理页,选择’打包扩展程序’,然后浏览到对应的目录–>进入选择对应版本!打包 打包后的crx文件将保存在chrome扩展程序目录对应ID的文件夹里:   附: adblock , adblock plus 插件每次安装后都会打开welcome新页面, 进入文件夹里文件–>abp-background.js 或者 background.js 里面, 设置 defaults.suppress_first_run_page = true; 就关闭自动打开新页面!      

Win10自动更新怎么永久关闭?有效的Win10强制更新关闭方法

服务中关闭Win10自动更新 1、首先使用 Win + R 组合快捷键,打开运行对话框,然后输入命令 services.msc ,点击下方的“确定”打开服务,如下图所示。 2、在Win10服务设置中找到 「 Windows Update 」选项,并双击打开,如图所示。 3、然后在Windows Update属性设置中,将启动类型改为「 禁用 」,再点击下方的「 停止 」,最后再点击底部的「 应用 」保存设置,如下图所示。 4、接下来再切换到「恢复 」选项,将默认的「重新启动服务 」改为「无操作 」,完成后点击下方的「应用 」,如下图所示。 注册表中关闭Win10自动更新 5、为了防止Win10自动更新还会死灰复燃,我们还需要在注册表设置中巩固一下。首先使用 Win + R 组合快捷键,打开运行对话框,然后输入命名 regedit,然后点击下方的「 确定 」打开注册表,如图所示。 6、在注册表设置中,找到并定位到 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\UsoSvc]。然后在右侧找到“Start”键,右键点击修改,把start值改成16进制,值改为“4”,然后点击「 确定 」保存数据,如图所示。 7、继续在右侧找到“FailureActions”键,右键点击修改该键的二进制数据,将“0010”、“0018”行的左起第5个数值由原来的“01”改为“00”,完成后,点击下方的“确定”即可,如图所示。 服务中关闭Win10更新关联服务 8、再次使用“WIN+R”组合快捷键打开运行操作框,输入命令“services.msc”,点击下方确定打开服务,然后在服务中找到“Windows Update Medic Service”选项,双击打开,将启动类型改为「禁用 」,如图所示。 9、之后在Win10服务设置中,再找到“Update Orchestrator Service”服务选项,双击打开,将启动类型改为「禁用 」,并「停止 」,完成后,点击下方的“确定”保存就可以了,如图所示。 组策略关闭Win10自动更新服务 10、为了防止Win10自动更新死灰复燃,我们还可以在组策略中关闭Win10更新,具体操作是:使用 Win +… Read More »

CENTOS 7 FIREWALLD详解,添加删除策略

CENTOS7中FIREWALL防火墙 修改防火墙配置文件之前,需要对之前防火墙【/etc/firewalld/zones/public.xml】做好备份 重启防火墙后,需要确认防火墙状态和防火墙规则是否加载,若重启失败或规则加载失败,则所有请求都会被防火墙。 1.firewall-cmd –state           #查看firewall的状态   firewall-cmd –list-all        #查看防火墙规则(只显示/etc/firewalld/zones/public.xml中防火墙策略)   firewall-cmd –list-all-zones  #查看所有的防火墙策略(即显示/etc/firewalld/zones/下的所有策略)   firewall-cmd –reload          #重新加载配置文件 2、关闭firewall:   systemctl stop firewalld.service      #停止firewall   systemctl disable firewalld.service   #禁止firewall开机启动   firewall-cmd –state                … Read More »

SwitchyOmega访问Google / Gmail 服务器的代理策略

SwitchyOmega访问Google服务的策略! 问题:添加 *.google.com 后可以访问gmail,但是登录就提示’Connection failed’并退出! 解决:添加 *.googleapis.com 代理测试后解决! Chrome Webstore的插件安装 解决:添加 *.googleusercontent.com 代理策略

User Agent各参数解释

以下是几个常见的User Agent Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36 Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36 Edg/86.0.622.63 Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36 OPR/72.0.3815.320 Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0 Mozilla/5.0 (Macintosh; Intel Mac OS X… Read More »

Selenium 中ExpectedConditions 用法说明(最全整理)

首先导入包 from selenium.webdriver.support import expected_conditions as EC 1,判断当前页面的title是否精确等于预期 titleIs( String title) EC.title_is(‘Google’) 2,判断当前页面的title是否包含预期字符串 titleContains( String title) if EC.title_contains(’google’):   ##等于 if ‘google’ in driver.title: 3,判断当前页面的url是否精确等于预期 urlToBe( String url) 4,判断当前页面的url是否包含预期字符串 urlContains( String fraction) 5,当前URL字符串正则表达式匹配 urlMatches( String regex) 6,判断元素是否出现,只要有一个元素出现,就通过。(出现不代表可见) 判断是否至少有 1 个元素存在于 dom 树中。举个例子,如果页面上有 n 个元素的 class 都是’column-md-3’,那么只要有 1 个元素存在,这个方法就返回 True。 presenceOfElementLocated( By locator) 7,判断元素是否出现,必须所有符合条件的元素都加载出来,才通过。 presenceOfElementsLocated( By… Read More »

获取免费无限个Gmail邮箱

免费Gmail邮箱无限别名: 用户名[email protected]可以有一下几种变形 1,[email protected] 用户名之间加“点”符号。Gmail的用户名是不区分“.”符号的,abcdef,a.bcdef,abc.def和abcd.ef其实都是同一个用户名。 2,[email protected] 用户名后面加“加号”。+hi,+my,+baidu……,“+”号后面可以是任意字符的。 3,[email protected] 把后缀变为googlemail.com 4,[email protected] 以上3钟方法的结合。 Google域名邮箱’Catch-all address’到主邮箱: 主邮箱 [email protected] 可以接收所有未定义前缀的邮箱,比如 (any)@houyunbo.com https://admin.google.com/ Apps ==> Google Workspace==> Gmail ==> Advanced settings

mitmproxy抓https出现502Bad Gateway. unable to get local issuer certificate的解决方法

502 Bad Gateway. Certificate Verification Error for www.xxxx.com: unable to get local issuer certificate (errno: 20, depth: 0) 想到可能是当前证书不支持,网上找一个最新的cacert.pem替换certifi包(xx\python36\Lib\site-packages\certifi)目录的证书,再次使用可以抓到包了。 参考资料 https://github.com/mitmproxy/mitmproxy/issues/1608 https://curl.haxx.se/docs/caextract.html