百度ai人脸识别颜值(百度ai人脸识别颜值怎么用)

孤僻成性 2023-08-17 12:42:12 网友分享

知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测)

1 数据源

知乎话题『美女』下所有问题中回答所出现的图片

2 抓取工具

Python 3,并使用第三方库 Requests、lxml、AipFace,代码共 100 + 行

3 必要环境

Mac / Linux / Windows (Linux 没测过,理论上可以。Windows 之前较多反应出现异常,后查是 windows 对本地文件名中的字符做了限制,已使用正则过滤)无需登录知乎(即无需提供知乎帐号密码)人脸检测服务需要一个百度云帐号(即百度网盘 / 贴吧帐号)

4 人脸检测库

AipFace,由百度云 AI 开放平台提供,是一个可以进行人脸检测的 Python SDK。可以直接通过 HTTP 访问,免费使用。

5 检测过滤条件

过滤所有未出现人脸图片(比如风景图、未露脸身材照等)过滤所有非女性(在抓取中,发现知乎男性图片基本是明星,故不考虑;存在 AipFace 性别识别不准的情况)过滤所有非真实人物,比如动漫人物 (AipFace Human 置信度小于 0.6)过滤所有颜值评分较低图片(AipFace beauty 属性小于 45,为了节省存储空间;再次声明,AipFace 评分无任何客观性)

6 实现逻辑

通过 Requests 发起 HTTP 请求,获取『美女』下的部分讨论列表通过 lxml 解析抓取到的每个讨论中 HTML,获取其中所有的 img 标签相应的 src 属性通过 Requests 发起 HTTP 请求,下载 src 属性指向图片(不考虑动图)通过 AipFace 请求对图片进行人脸检测判断是否检测到人脸,并使用 『4 检测过滤条件』过滤将过滤后的图片持久化到本地文件系统,文件名为 颜值 + 作者 + 问题名 + 序号返回第一步,继续

7 抓取结果

直接存放在文件夹中(angelababy 实力出境)。另外说句,目前抓下来的图片,除 baby 外,88 分是最高分。个人对其中的排序表示反对,老婆竟然不是最高分

代码

9 运行准备

安装 Python 3,Download Python安装 requests、lxml、baidu-aip 库,都可以通过 pip 安装,一行命令申请百度云检测服务,免费。人脸识别-百度AI

为了帮助大家更轻松的学好Python开发技术,Python爬虫,Python数据分析,人工智能等技术,这里给大家分享一套系统教学资源,,关注我头条号,然后私信我‘2020’几个数字免费领取。还有专业的老司机免费答疑!(注意私信我关键字不要写错,可以复制)

知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测)

1 数据源

知乎话题『美女』下所有问题中回答所出现的图片

2 抓取工具

Python 3,并使用第三方库 Requests、lxml、AipFace,代码共 100 + 行

3 必要环境

Mac / Linux / Windows (Linux 没测过,理论上可以。Windows 之前较多反应出现异常,后查是 windows 对本地文件名中的字符做了限制,已使用正则过滤)无需登录知乎(即无需提供知乎帐号密码)人脸检测服务需要一个百度云帐号(即百度网盘 / 贴吧帐号)

4 人脸检测库

AipFace,由百度云 AI 开放平台提供,是一个可以进行人脸检测的 Python SDK。可以直接通过 HTTP 访问,免费使用。

5 检测过滤条件

过滤所有未出现人脸图片(比如风景图、未露脸身材照等)过滤所有非女性(在抓取中,发现知乎男性图片基本是明星,故不考虑;存在 AipFace 性别识别不准的情况)过滤所有非真实人物,比如动漫人物 (AipFace Human 置信度小于 0.6)过滤所有颜值评分较低图片(AipFace beauty 属性小于 45,为了节省存储空间;再次声明,AipFace 评分无任何客观性)

6 实现逻辑

通过 Requests 发起 HTTP 请求,获取『美女』下的部分讨论列表通过 lxml 解析抓取到的每个讨论中 HTML,获取其中所有的 img 标签相应的 src 属性通过 Requests 发起 HTTP 请求,下载 src 属性指向图片(不考虑动图)通过 AipFace 请求对图片进行人脸检测判断是否检测到人脸,并使用 『4 检测过滤条件』过滤将过滤后的图片持久化到本地文件系统,文件名为 颜值 + 作者 + 问题名 + 序号返回第一步,继续

7 抓取结果

直接存放在文件夹中(angelababy 实力出境)。另外说句,目前抓下来的图片,除 baby 外,88 分是最高分。个人对其中的排序表示反对,老婆竟然不是最高分

代码

9 运行准备

安装 Python 3,Download Python安装 requests、lxml、baidu-aip 库,都可以通过 pip 安装,一行命令申请百度云检测服务,免费。人脸识别-百度AI

为了帮助大家更轻松的学好Python开发技术,Python爬虫,Python数据分析,人工智能等技术,这里给大家分享一套系统教学资源,,关注我头条号,然后私信我‘2020’几个数字免费领取。还有专业的老司机免费答疑!(注意私信我关键字不要写错,可以复制)

Python爬取图片+百度人脸检测过滤高颜值美女

pexels网站提供了大量贴图,从中搜索美女图片,编写爬虫进行下载,下载后图片中除了女人外,还包含男人,风景、静物和动物,调用百度人脸检测模块识别检测,将其中颜值大于60分的美女保存到另外一个文件夹。爬取图片共计1251张,最后过滤出的美女共计287张。上代码:

爬虫程序:

from bs4 import BeautifulSoupimport requestsimport osimport timesave_path = 'F://photos/'url_path = '/d/file/gt/2023-06/zpu20smvafd ={'accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36'}searchWord = 'beauty'urls = [url_path+searchWord+'/?page={}'.format(str(i)) for i in range(1,100)]if not os.path.exists(save_path):os.mkdir(save_path)page =1for url in urls:img_list =wb_data = requests.get(url,headers=headers)print(\"当前爬取页面链接\",url)soup = BeautifulSoup(wb_data.text,'lxml')imgs = soup.select('article > a > img')for img in imgs:photo_src = img.get('src')img_listend(photo_src)print(\"第{}页,共计{}张图片\".format(page,len(img_list)))for item in img_list:data = requests.get(item, headers=headers)fp = open(save_path+item.split('?')[0][-10:],'wb')fp.write(datantent)fp.closepage = page+1time.sleep(2)

颜值检测程序:

from aip import AipFaceimport base64import osimport timeimport shutil#接入百度AI人脸识别的参数APP_ID=\"换成你自己的\"API_KEY = \"换成你自己的\"SECRET_KEY = \"换成你自己的\"imageType = \"BASE64\"options = {}options[\"face_field\"] = \"gender,beauty\"options[\"face_type\"] = \"LIVE\"#下载图片和筛选图片的文件夹file_path = 'F://photos/'copy_file_path = 'F://highScore/'file_lists=os.listdir(file_path)aipFace =AipFace(APP_ID,API_KEY,SECRET_KEY)#将图片转换为BASE64格式,这是百度平台的要求def get_file_content(filePath):with open(filePath,'rb') as fp:content = base64.b64encode(fp.read)return content.decode('utf-8')for file_list in file_lists:result = aipFace.detect(get_file_content(os.path.join(file_path,file_list)),imageType,options)error_code = result['error_code']if error_code == 222202:#没有人脸continueif error_code==223110:#人脸太多continuetry:_type = result['result']['face_list'][-1]['gender']['type']#只要美女图片if _type == 'male':continuebeauty = result['result']['face_list'][-1]['beauty']new_beauty = round(beauty/10,1)print(file_list,new_beauty)if new_beauty>=6:copy_src = os.path.join(file_path,str(new_beauty)+'_'+file_list)copy_dst = os.path.join(copy_file_path,str(new_beauty)+'_'+file_list)#重命名高分照片osame(os.path.join(file_path,file_list),copy_src)#复制高分照片到另外的照片shutilpyfile(copy_src,copy_dst)time.sleep(1)except KeyError:pascept TypeError:pass

爬取的图片:

过滤后的图片:

看看最高颜值的美女:

较低颜值的女性:

PS:如果觉得本篇文章对您有所帮助,欢迎关注、订阅!帮忙点个 再看 转发一下分享出去

*声明:本文于网络整理,版权归原作者所有,如来源信息有误或侵犯权益,请联系我们删除或授权事宜。

这款“颜值检测”软件背后有蹊跷|今晚九点半

这款号称能够“AI看相智能打分”的

手机软件

实际以“检测颜值”为娱乐噱头

吸引网友下载

非法获取安装者手机相册图片

从而侵犯公民个人信息

……

始于“颜值检测”,终于“盗图”提取信息——这款号称“AI看相智能打分”的手机软件,以“检测颜值”为娱乐噱头吸引网友下载,非法获取安装者手机相册图片。这是上海市奉贤区检察院办理的一起利用“黑客软件”非法读取安装者手机相册图片从而侵犯公民个人信息的案件。

制作软件称可进行颜值检测

2021年9月28日,检察机关执行监督被告人李某删除数据。

李某是上海某网络科技公司的软件开发人员。2020年6月至9月,他将获取的一段源代码制作成一款具有窃取安装者手机相册照片功能的“黑客软件”,并发布在某网络平台售卖,赚取虚拟币。“为了炫耀自己的技术,后来我又把这款软件伪装成‘颜值检测’软件,放在论坛上供人免费下载。”李某交代说。

李某声称该软件可以对带有脸部元素的照片进行自动评分,能对用户的年龄、颜值、皮肤健康度、色斑度等方面进行“专业打分”,用户只要上传带有脸部元素的照片,就会得到有关这些情况的分析结果。“这款软件真的具有颜值检测功能吗?”面对办案检察官的讯问,李某作出了明确回答——“没有,它的真实功能就是把软件安装者手机里的照片上传到我的服务器上。”

据李某交代,当手机用户下载安装该软件并打开使用时,该软件就会自动获取安装者手机相册照片,并自动上传存储至他搭建的服务器后台。经查,该软件共窃取安装者手机相册照片1751张,其中部分照片含有人脸信息、自然人姓名、身份证号码、联系方式、家庭住址等100余条公民个人信息。

他在网上分享获得的公民个人信息

2021年8月23日,上海市奉贤区法院开庭审理李某侵犯公民个人信息案。

据办案检察官介绍,李某用售卖“黑客软件”获得的虚拟币在暗网上购买了含有QQ注册信息、借贷信息、车主信息等内容的“XX库资料”,并转存至网盘,这些信息资料的电子文档容量超过30GB。为了炫耀自己有能力“拿到”公民个人信息,李某还将这些信息资料免费分享到QQ群中。

2021年3月9日,公安机关将李某抓获。经鉴定,该资料包含公民个人信息1.5亿余条,经去除无效数据、合并去重后共计8100余万条。同年5月28日,公安机关将该案移送至检察机关审查起诉。

奉贤区检察院经审查认为,犯罪嫌疑人李某违有关规定,利用侵入计算机信息系统程序窃取、非法获取并向他人提供公民个人信息,犯罪事实清楚,证据确实充分,构成侵犯公民个人信息罪。2021年8月10日,该院以李某涉嫌侵犯公民个人信息罪向法院提起公诉。

2021年8月23日,法院公开开庭审理此案。李某的辩护人认为,李某只是一名游戏开发人员,出于炫耀自己能耐的目的才去暗网购买个人信息,并未用于其他转卖或违法犯罪用途,主观恶性相对较小;且其购买的公民个人信息经过专业加密处理,一般网民无法打开,社会危害性较小。

对此,公诉人指出,“8100余万条公民个人信息,数量巨大,且在其中随机抽取并倒查10名信息所有人,均能证实这些被窃取信息是完全真实的,李某也曾打开信息包核验这些信息的真实性。虽然信息包有加密处理,但还是有人能打开它,如此造成的社会危害是现实而紧迫的。”

下载软件要谨慎,自拍照要保护好

“凭借自己懂点技术就做出这种违法乱纪之事,我对此感到很后悔。希望广大网友保护好自己的个人信息,辨别网上的有害软件。”法庭上,被告人李某对其犯罪行为后悔不已。

法院当庭作出一审判决,支持了检察机关的指控意见和提出的量刑建议,判处李某有期徒刑三年,缓刑三年,并处罚金1万元,同时支持检察机关公益诉讼全部请求:判令李某在国家级新闻媒体上对其侵犯公民个人信息的行为公开赔礼道歉,删除“颜值检测”软件及相关代码,删除网盘存储的照片及相关公民个人信息,注销侵权所用的QQ号。

2021年9月28日,奉贤区检察院检察官协同检察技术人员来到区法院,在多方见证之下,验证并彻底删除了涉案软件、相关代码及个人信息,涉案QQ号码及网盘均已注销,相关犯罪工具由法院没收处理。执行过程全程录音录像、屏幕录屏,确保信息已经删除到位。

“在本案涉及的8100余万条公民个人信息中,包含了很多自拍照片。”检察官提醒,自拍照中的人脸信息属于生物识别信息中社交属性最强、最易采集的个人信息,具有唯一性和不可更改性。犯罪分子可以利用非法获取的人脸信息、身份证照片等,制作成动态视频,破解人脸识别验证程序,结合窃取的联系方式、家庭住址等信息,用于侵害隐私权、名誉权等非法活动,甚至将盗取的信息用于、、虚开增值税专用等犯罪活动。因此,一定要谨慎对待手机应用软件的下载与使用,通过正规渠道下载安装,审慎开放软件的隐私读取权限,减少上传包含重要个人信息的图片文件等,以免个人信息泄露、公民合法权益被侵害。(检察日报 明镜周刊 孙晓光)

免责声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件举报,一经查实,本站将立刻删除。

扫一扫在手机阅读、分享本文