会员登录 立即注册

搜索

AI视觉

[复制链接]
崎山小鹿 发表于 2024-3-3 14:04:12 | 显示全部楼层 |阅读模式
崎山小鹿
2024-3-3 14:04:12 981 0 看全部
stable diffusion,fooocus能识别图片,甚至能识别视频,那他们的原理是什么呢?

手势的识别:
python代码:
import cv2
import mediapipe as mp
import time

cap = cv2.VideoCapture(0)

mpHands = mp.solutions.hands
hands = mpHands.Hands()
mpDraw = mp.solutions.drawing_utils

pTime = 0
cTime = 0

while True:
    success, img = cap.read()
    imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # 2 = to
    results = hands.process(imgRGB)
    # print(results.multi_hand_landmarks)//检查手坐标输出
    if results.multi_hand_landmarks:
        for handLms in results.multi_hand_landmarks:
            for id, lm in enumerate(handLms.landmark):
                # print(id, lm)
                h, w, c = img.shape
                cx, cy = int(lm.x * w), int(lm.y * h)
                print(id, cx, cy)
                # if id == 4:
                cv2.circle(img, (cx, cy), 15, (255, 0, 255), cv2.FILLED)
            mpDraw.draw_landmarks(img, handLms, mpHands.HAND_CONNECTIONS)

    cTime = time.time()
    fps = 1 / (cTime - pTime)
    pTime = cTime

    cv2.putText(img, str(int(fps)), (10, 70), cv2.FONT_HERSHEY_PLAIN, 3,
                (255, 255, 255), 2)

    cv2.imshow("Image", img)
    cv2.waitKey(1)







人脸识别:
import mediapipe as mp
import cv2
import numpy as np


if __name__ == "__main__":
   
    # 构建脸部特征提取对象
    mp_face_mesh = mp.solutions.face_mesh
   
    face_mesh = mp_face_mesh.FaceMesh(static_image_mode=False,
                                       max_num_faces=1,
                                       refine_landmarks=True,
                                       min_detection_confidence=0.5,
                                       min_tracking_confidence=0.5)
    # 构建绘图对象
    mp_drawing = mp.solutions.drawing_utils
    mp_drawing_styles = mp.solutions.drawing_styles
   
    # 开启摄像头
    cap = cv2.VideoCapture(0)
   
    while True:
        # 读取一帧图像
        success, img = cap.read()
        if not success:
            continue
            
        # 获取宽度和高低
        image_height, image_width, _ = np.shape(img)
        
        # BGR 转 RGB
        img_RGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        
        # 进行特征点提取
        results = face_mesh.process(img_RGB)
        
        if results.multi_face_landmarks:

            for face_landmarks in results.multi_face_landmarks:
               
                # 利用 内置的mp_drawing 进行绘图
                # mp_drawing.draw_landmarks(image=img,
                                          # landmark_list=face_landmarks,
                                          # connections=mp_face_mesh.FACEMESH_TESSELATION,
                                          # landmark_drawing_spec=None,
                                          # connection_drawing_spec=mp_drawing_styles
                                          # .get_default_face_mesh_tesselation_style())
                # mp_drawing.draw_landmarks(image=img,
                                          # landmark_list=face_landmarks,
                                          # connections=mp_face_mesh.FACEMESH_CONTOURS,
                                          # landmark_drawing_spec=None,
                                          # connection_drawing_spec=mp_drawing_styles
                                          # .get_default_face_mesh_contours_style())
                # mp_drawing.draw_landmarks(
                                            # image=img,
                                            # landmark_list=face_landmarks,
                                            # connections=mp_face_mesh.FACEMESH_IRISES,
                                            # landmark_drawing_spec=None,
                                            # connection_drawing_spec=mp_drawing_styles
                                            # .get_default_face_mesh_iris_connections_style())
            
                # 自行计算478个关键点的坐标 并绘制
                if  face_landmarks:
                    # 计算关键点坐标
                    for i in range(478):
                        pos_x = int(face_landmarks.landmark\[i\]. x* image_width)
                        pos_y = int(face_landmarks.landmark\[i\]. y* image_height)
                        
                        cv2.circle(img, (pos_x,pos_y), 3, (0,255,0),-1)
                        
        
        
        cv2.imshow("face-mesh",img)

        key =  cv2.waitKey(1) & 0xFF   

        # 按键 "q" 退出
        if key ==  ord('q'):
            break
    cap.release()
      
   
   


OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,安装的时候是 opencv_python,但在导入的时候采用 import cv2。更多
MediaPipe 是由 Google Research 開發的開源框架,於2019年6月提出的開源框架,用於構建多媒體機器學習應用。更多























附:
百度ai大脑能从视频中分析出:
1.视频内容分析,为视频文件或直播流的内容打标签,可输出视频的场景、公众人物、地点、实体和关键词等结构化标签信息。
2.图片内容分析,为图片内容打标签,可输出图片中公众人物、logo、实体和关键词等结构化标签信息。
3.智能封面,通过对视频、图像等内容理解,从图像清晰度、构图美学和精彩程度等方面分析,生成视频的静态封面、动态封面和视频封面。
4.精彩视频分析,通过场景切分、音频特征分析等技术,提取影视综长视频中的高光时刻。
>>来源<<


腾讯云
1、视频内容理解
传统的视频能力就是将现场的视频收集传送到后台,而AI视频分析可对视频中的对象、场景、动作等内容进行识别,从而对视频进行标记与分类。
2、视频目标检测和跟踪
AI视频分析还支持自动识别算法,例如,大家熟知的TSINGSEE青犀视频智能分析平台,就可以识别视频中人、车、物体、行为而等,并通过智能跟踪算法追踪车辆等运动轨迹。
3、行为分析
AI视频分析中必不可少还有行为分析能力,如人的动作、表情、姿态等,就像如今应用十分广泛的TSINGSEE青犀AI算法中的人员在岗离岗、人员跌倒、人员打电话抽烟等。
目前旭帆科技已经将人工智能融合到平台之中,里面的实用算法更是涵盖到了各个场景之中,包括智慧工厂、智慧工地、智慧社区、智慧校园等。除此之外,AI算法平台/视频智能分析系统还能与安防监控系统EasyCVR视频汇聚平台结合使用,最大限度提高视频数据的利用率和效率,为用户提供更加智能化和个性化的行业可视化视频监管解决方案。

来源:腾讯云社区

google云
精确的视频分析:识别存储的视频和流式视频中的 2 万多种对象、地点和操作。提取视频级、镜头级或帧级的丰富元数据。使用 AutoML Video Intelligence 创建您自己的自定义实体标签。
简化媒体管理:按照搜索文档的方式搜索视频目录。并且可以提取元数据,以将视频内容编入索引并对其进行整理、搜索、控制和过滤,从而提供相关度最高的结果。
轻松构建智能的视频应用:使用流式视频注释服务近乎实时地从视频中提取实用信息,并根据检测到的对象触发事件。使用精选短片集、推荐等功能,打造富有吸引力的客户体验。
来源:google云


技术实现原理:
AI 引擎会自动逐帧详细检查视频流,提供 24/7 稳定、可靠的结果。


知乎:
实时 AI 视频分析如何工作?
在设计 AI 视频分析系统时,开发工程师最初会从多个角度研究和分析问题。这有助于他们了解问题的背景,并评估哪些潜在的技术方法将提供最佳结果。
接下来,他们继续创建和测试 AI 算法,以识别视频帧中所需的对象和事件。这是最具挑战性的阶段,涉及数学、软件知识和反复试验。
一旦找到获胜的算法解决方案,开发工程师就会训练系统通过将其暴露于大量图像来识别和分类对象。例如,为了训练系统识别猫,将包含猫(和非猫)的大型图像数据集输入机器,以便它可以从尽可能多的示例中学习猫的样子。
随着训练阶段的完成,该系统已准备好在现实生活中进行部署。人工智能引擎的一个关键特性是,随着时间的推移,它会继续自我学习,适应从视频流中接收到的数据和变化。 开发工程师还将继续观察系统的性能并在必要时进行优化。
知乎

run main

run main

tmediapipe.py

1.11 KB, 下载次数: 0

人手识别

face_base.py

3.46 KB, 下载次数: 0

人脸识别

回复

使用道具 举报

  • 您可能感兴趣
您需要登录后才可以回帖 登录 | 立即注册 |

本版积分规则 返回列表

查看:981 | 回复:0

  • 可视化硬盘文件分布SpaceSniffer

    有时候硬盘很满了,又不知道是哪个程序占用了太多的空间。 SpaceSniffer可以很直观

    阅读:174|2024-09-16
  • 武汉墨家人俱乐部

    这里有VR 各种AI软件 绘图 炼丹 地址:

    阅读:250|2024-09-11
  • 入手一个3D数字人要多少钱?

    上一期给大家讲了什么是数字人,今天给大家讲入手一个3D数字人要多少钱? 数字人包括

    阅读:223|2024-09-11
  • 让人物照片跳舞vigen追影

    本质上是一种视频换脸技术的升级版,视频换身。 项目体验地址: https://www.modelsco

    阅读:246|2024-09-08
  • 视频生成3D模型luma AI Dashboard

    他可以根据一段视频生成3D环境模型,他能根据视频角度去完善模型,对模型进行AI补全,

    阅读:199|2024-09-08
  • 本地部署Llama 3.1大模型

    Meta推出的Llama 3.1系列包括80亿、700亿、4050亿参数版本,上下文长度扩展至12.8万to

    阅读:261|2024-09-08
  • 生成身临其境的环境模型

    清华大学创作的AI软件 aiuni Aiuni.ai是一个基于Unique3D的在线AI图片转3D模型生成建

    阅读:272|2024-09-07
  • 声音克隆工具CosyVoice

    阿里的免费声音克隆工具CosyVoice CosyVoice 是阿里通义实验室在七月初开源的一款专

    阅读:196|2024-09-07
  • 墨者的几个阶段

    一、知毛泽东,不知有墨子。 二、知墨子,但依然儒法道行事。 三、知墨子,尝试墨家

    阅读:375|2024-08-31
  • 图生产3D模型

    https://hyperhuman.deemos.com/ 上传图片,点击生成 可以多生成几次,点击应用

    阅读:380|2024-08-30
金双石科技,软件开发20年,技术行业领先,您的满意,就是我们的目标,认真负责,开拓进取,让成品物超所值
关于我们
公司简介
发展历程
联系我们
本站站务
友情链接
新手指南
内容审核
商家合作
广告合作
商家入驻
新闻合作

手机APP

官方微博

官方微信

联系电话:15876572365 地址:深圳市宝安区西乡街道宝民二路宝民花园 ( 粤ICP备2021100124号-1 ) 邮箱:qishanxiaolu@qq.com
QQ|Powered by Discuz! X3.5 © 2001-2024 Discuz! Team.
快速回复 返回顶部 返回列表