喉咙识别方法、装置、系统、存储介质以及设备.pdf

上传人:磨** 文档编号:11349045 上传时间:2021-09-19 格式:PDF 页数:16 大小:778.19KB
收藏 版权申诉 举报 下载
喉咙识别方法、装置、系统、存储介质以及设备.pdf_第1页
第1页 / 共16页
喉咙识别方法、装置、系统、存储介质以及设备.pdf_第2页
第2页 / 共16页
喉咙识别方法、装置、系统、存储介质以及设备.pdf_第3页
第3页 / 共16页
文档描述:

《喉咙识别方法、装置、系统、存储介质以及设备.pdf》由会员分享,可在线阅读,更多相关《喉咙识别方法、装置、系统、存储介质以及设备.pdf(16页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910422931.3 (22)申请日 2019.05.21 (71)申请人 中山大学 地址 510275 广东省广州市海珠区新港西 路135号 (72)发明人 黄斐铨宋嵘 (74)专利代理机构 广州骏思知识产权代理有限 公司 44425 代理人 潘桂生 (51)Int.Cl. G06T 7/00(2017.01) (54)发明名称 喉咙识别方法、 装置、 系统、 存储介质以及设 备 (57)摘要 本发明涉及一种喉咙识别方法、 装置、 系统、 存储介质以及设备, 其中的方法。

2、包括: 获取待识 别的喉咙图像; 将待识别的喉咙图像输入至第一 喉咙识别模型中进行识别, 并从待识别的喉咙图 像中确定出喉咙图像; 第一喉咙识别模型为通过 喉咙样本图像和非喉咙样本图像进行训练后建 立的模型; 将喉咙图像输入至第二喉咙识别模型 中进行识别, 获得喉咙的状态分值; 第二喉咙识 别模型为通过喉咙样本图像以及对应的喉咙的 状态分值进行训练后建立的模型。 本公开发现通 过拍摄获取待识别的喉咙图像, 再通过第一喉咙 识别模型和第二喉咙识别模型对待识别的喉咙 图像进行识别, 从而获得喉咙的状态分值, 进而 使用户无需依赖他人和专业人群, 即可方便快捷 地获悉喉咙的状态。 权利要求书2页 说。

3、明书8页 附图5页 CN 110148124 A 2019.08.20 CN 110148124 A 1.一种喉咙识别方法, 其特征在于, 包括如下步骤: 获取待识别的喉咙图像; 将待识别的喉咙图像输入至第一喉咙识别模型中进行识别, 并从待识别的喉咙图像中 确定出喉咙图像; 其中, 所述第一喉咙识别模型为通过喉咙样本图像和非喉咙样本图像进 行训练后建立的模型; 将喉咙图像输入至第二喉咙识别模型中进行识别, 获得喉咙的状态分值; 其中, 所述第 二喉咙识别模型为通过喉咙样本图像以及对应的喉咙的状态分值进行训练后建立的模型。 2.根据权利要求1所述的喉咙识别方法, 其特征在于, 所述将待识别的喉咙。

4、图像输入至 第一喉咙识别模型中进行识别, 并从待识别的喉咙图像中确定出喉咙图像的步骤, 包括: 将待识别的喉咙图像切分为多个同等大小的图像窗口; 将各个所述图像窗口分别输入至第一喉咙识别模型中, 获得各个图像窗口的喉咙分 值; 如果最高的喉咙分值超过第一设定阈值, 则将该最高的喉咙分值对应的图像窗口作为 喉咙图像。 3.根据权利要求2所述的喉咙识别方法, 其特征在于, 如果最高的喉咙分值超过第一设 定阈值, 则提示该待识别的喉咙图像不包括喉咙图像的信息。 4.根据权利要求1所述的喉咙识别方法, 其特征在于, 所述将喉咙图像输入至第二喉咙 识别模型中进行识别, 获得喉咙的状态分值的步骤之后, 还。

5、包括: 如果喉咙的状态分值超过第二设定阈值, 则提示喉咙为异常的信息。 5.根据权利要求1所述的喉咙识别方法, 其特征在于, 所述将喉咙图像输入至第二喉咙 识别模型中进行识别, 获得喉咙的状态分值的步骤之后, 还包括: 如果喉咙的状态分值没有超过第二设定阈值, 则提示喉咙为正常的信息。 6.根据权利要求1-5中任一权利要求所述的喉咙识别方法, 其特征在于, 所述将待识别 的喉咙图像输入至第一喉咙识别模型中进行识别, 并从待识别的喉咙图像中确定出喉咙图 像之后, 还包括: 获取所述喉咙图像的坐标信息; 根据所述喉咙图像的坐标信息, 计算喉咙图像的中心坐标; 如果喉咙图像的中心坐标中的横坐标在设定。

6、的横坐标范围内, 且喉咙图像的中心坐标 中的横坐标在设定的纵坐标范围内, 则将所述喉咙图像输入至第二喉咙识别模型中进行识 别, 获得喉咙的状态分值; 如果喉咙图像的中心坐标中的横坐标不在设定的横坐标范围内, 则如果喉咙图像的中 心坐标中的横坐标与设定的横坐标的差值小于0, 则提示获取待识别的喉咙图像的摄像装 置向左移动; 如果喉咙图像的中心坐标中的横坐标与设定的横坐标的差值大于0, 则提示获 取待识别的喉咙图像的摄像装置向右移动, 则将待识别的喉咙图像输入至第一喉咙识别模 型中进行识别, 并从待识别的喉咙图像中确定出喉咙图像; 如果喉咙图像的中心坐标中的横坐标在设定的横坐标范围内, 但喉咙图像。

7、的中心坐标 中的纵坐标不在设定的纵坐标范围内, 则如果喉咙图像的中心坐标中的纵坐标与设定的纵 坐标的差值小于0, 则提示获取待识别的喉咙图像的摄像装置向上移动; 如果喉咙图像的中 心坐标中的纵坐标与设定的纵坐标的差值大于0, 则提示获取待识别的喉咙图像的摄像装 权利要求书 1/2 页 2 CN 110148124 A 2 置向下移动; 则将待识别的喉咙图像输入至第一喉咙识别模型中进行识别, 并从待识别的 喉咙图像中确定出喉咙图像。 7.一种喉咙识别装置, 其特征在于, 包括: 图像获取模块, 用于获取待识别的喉咙图像; 喉咙图像确定模块, 用于将待识别的喉咙图像输入至第一喉咙识别模型中进行识别。

8、, 并从待识别的喉咙图像中确定出喉咙图像; 其中, 所述第一喉咙识别模型为通过喉咙样本 图像和非喉咙样本图像进行训练后建立的模型; 状态分值确定模块, 用于将喉咙图像输入至第二喉咙识别模型中进行识别, 获得喉咙 的状态分值; 其中, 所述第二喉咙识别模型为通过喉咙样本图像以及对应的喉咙的状态分 值进行训练后建立的模型。 8.一种计算机可读存储介质, 其上储存有计算机程序, 其特征在于, 该计算机程序被处 理器执行时实现如权利要求1至6中任意一项所述的喉咙识别方法的步骤。 9.一种喉咙识别系统, 其特征在于, 包括存储器, 处理器以及储存在所述储存器中并可 被所述处理器执行的计算机程序, 所述处。

9、理器执行所述计算机程序时实现如权利要求1至6 中任意一项所述的喉咙识别方法的步骤。 10.一种喉咙识别设备, 其特征在于, 包括摄像装置和图像处理装置, 所述摄像装置用 于拍摄待识别的喉咙图像, 所述图像处理装置用于实现如权利要求1至6中任意一项所述的 喉咙识别方法的步骤。 权利要求书 2/2 页 3 CN 110148124 A 3 喉咙识别方法、 装置、 系统、 存储介质以及设备 技术领域 0001 本发明涉及图像检测领域, 特别是涉及一种喉咙识别方法、 装置、 系统、 存储介质 以及设备。 背景技术 0002 随着全球变暖、 环境恶化越来越严重, 人们经常会觉得耳鼻喉出现异常的情况。 喉。

10、 咙是连接口腔和肺胃的通路, 又为经脉循行的要冲, 喉咙直接与外部环境接触, 在用嗓过度 或食用刺激性食物或受到刺激性气味时易造成异常。 0003 发明人在实现本发明的过程中, 发现喉咙由于处于口腔内部, 个人难以清楚的获 悉喉咙当前的状态情况, 需要依赖于他人乃至需要专业的人来查看喉咙状态, 给人带来了 不便。 发明内容 0004 为克服相关技术中存在的问题, 本公开提供了一种喉咙识别方法、 装置、 系统、 存 储介质以及设备。 0005 根据本公开实施例的第一方面, 提供一种喉咙识别方法, 包括如下步骤: 0006 获取待识别的喉咙图像; 0007 将待识别的喉咙图像输入至第一喉咙识别模型。

11、中进行识别, 并从待识别的喉咙图 像中确定出喉咙图像; 其中, 所述第一喉咙识别模型为通过喉咙样本图像和非喉咙样本图 像进行训练后建立的模型; 0008 将喉咙图像输入至第二喉咙识别模型中进行识别, 获得喉咙的状态分值; 其中, 所 述第二喉咙识别模型为通过喉咙样本图像以及对应的喉咙的状态分值进行训练后建立的 模型。 0009 根据本公开实施例的第二方面, 提供一种喉咙识别装置, 包括: 0010 图像获取模块, 用于获取待识别的喉咙图像; 0011 喉咙图像确定模块, 用于将待识别的喉咙图像输入至第一喉咙识别模型中进行识 别, 并从待识别的喉咙图像中确定出喉咙图像; 其中, 所述第一喉咙识别。

12、模型为通过喉咙样 本图像和非喉咙样本图像进行训练后建立的模型; 0012 状态分值确定模块, 用于将喉咙图像输入至第二喉咙识别模型中进行识别, 获得 喉咙的状态分值; 其中, 所述第二喉咙识别模型为通过喉咙样本图像以及对应的喉咙的状 态分值进行训练后建立的模型。 0013 根据本公开实施例的第三方面, 提供一种计算机可读存储介质, 其上储存有计算 机程序, 该计算机程序被处理器执行时实现前述所述的喉咙识别方法的步骤。 0014 根据本公开实施例的第四方面, 提供一种喉咙识别系统, 包括存储器, 处理器以及 储存在所述储存器中并可被所述处理器执行的计算机程序, 所述处理器执行所述计算机程 序时实。

13、现如前述所述的喉咙识别方法的步骤。 说明书 1/8 页 4 CN 110148124 A 4 0015 根据本公开实施例的第五方面, 提供一种喉咙识别设备, 包括摄像装置和图像处 理装置, 所述摄像装置用于拍摄待识别的喉咙图像, 所述图像处理装置用于实现前述所述 的喉咙识别方法的步骤。 0016 由此, 本公开的实施例提供的技术方案可以包括以下有益效果: 0017 本公开实施例发现通过拍摄获取待识别的喉咙图像, 再通过第一喉咙识别模型和 第二喉咙识别模型对待识别的喉咙图像进行识别, 从而获得喉咙的状态分值, 进而使用户 无需依赖他人和专业人群, 即可方便快捷地获悉喉咙的状态。 0018 应当理。

14、解的是, 以上的一般描述和后文的细节描述仅是示例性和解释性的, 并不 能限制本公开。 0019 为了更好地理解和实施, 下面结合附图详细说明本发明。 附图说明 0020 图1为本公开的实施例的应用场景的示意图; 0021 图2为本公开一个示例性实施例示出的一种喉咙识别方法的流程图; 0022 图3为本公开一个示例性实施例示出的确定喉咙图像的方法的流程图; 0023 图4为本公开一个示例性实施例示出的建立第一喉咙识别模型的方法的流程图; 0024 图5为本公开一个示例性实施例示出的建立第二喉咙识别模型的方法的流程图; 0025 图6为本公开一个示例性实施例示出的调整待识别的喉咙图像的方法的流程图。

15、; 0026 图7为本公开一个示例性实施例示出的喉咙识别装置的结构示意框图; 0027 图8为本公开一个示例性实施例示出的喉咙识别装置的结构示意框图; 0028 图9为本公开一个示例性实施例示出的图像调整模块的结构示意框图。 具体实施方式 0029 这里将详细地对示例性实施例进行说明, 其示例表示在附图中。 下面的描述涉及 附图时, 除非另有表示, 不同附图中的相同数字表示相同或相似的要素。 以下示例性实施例 中所描述的实施方式并不代表与本公开相一致的所有实施方式。 相反, 它们仅是与如所附 权利要求书中所详述的、 本公开的一些方面相一致的装置和方法的例子。 0030 在本公开使用的术语是仅仅。

16、出于描述特定实施例的目的, 而非旨在限制本公开。 在本公开和所附权利要求书中所使用的单数形式的 “一种” 、“所述” 和 “该” 也旨在包括多数 形式, 除非上下文清楚地表示其他含义。 还应当理解, 本文中使用的术语 “和/或” 是指并包 含一个或多个相关联的列出项目的任何或所有可能组合。 0031 应当理解, 尽管在本公开可能采用术语第一、 第二、 第三等来描述各种信息, 但这 些信息不应限于这些术语。 这些术语仅用来将同一类型的信息彼此区分开。 例如, 在不脱离 本公开范围的情况下, 第一信息也可以被称为第二信息, 类似地, 第二信息也可以被称为第 一信息。 取决于语境, 如在此所使用的词。

17、语 “如果” 可以被解释成为 “在时” 或 “当 时” 或 “响应于确定” 。 0032 请参阅图1, 其是本公开的实施例的应用场景的示意图。 如图1所示, 通过摄像装置 11对着人13的喉咙进行拍摄, 获得拍摄的待识别的喉咙图像, 再将待识别的喉咙图像传送 给图像处理装置12; 图像处理装置12获取待识别的喉咙图像后, 对待识别的喉咙图像进行 说明书 2/8 页 5 CN 110148124 A 5 识别, 获得喉咙的状态分值。 其中, 摄像装置11和图像处理装置12可以集成于同一终端设备 内, 例如该终端设备可为带摄像头的手机、 带摄像头的ipad、 带摄像头的电脑等终端设备, 这些终端设。

18、备内可安装有图像处理应用, 进而可对拍摄的待识别的喉咙图像进行识别处 理, 获得喉咙的状态分值。 摄像装置11和图像处理装置12也可以不集成于同一终端设备内, 例如通过相机对着人的喉咙进行拍摄, 获得拍摄的待识别的喉咙图像, 再传送到手机、 ipad、 电脑等设备, 由手机、 ipad、 电脑安装的图像处理应用, 对待识别的喉咙图像进行识别 处理, 获得喉咙的状态分值。 0033 请参阅图2, 本公开一个示例性实施例示出的一种喉咙识别方法, 包括如下步骤: 0034 步骤S1: 获取待识别的喉咙图像。 0035 其中, 可以通过带摄像头的手机、 带摄像头的ipad、 带摄像头的电脑等设备拍摄获。

19、 得待识别的喉咙图像, 也可以通过专门用于拍摄的装置如相机获取用户待识别的喉咙图 像, 再传送到手机、 ipad、 电脑等处理设备。 0036 步骤S2: 将待识别的喉咙图像输入至第一喉咙识别模型中进行识别, 并从待识别 的喉咙图像中确定出喉咙图像; 其中, 所述第一喉咙识别模型为通过喉咙样本图像和非喉 咙样本图像进行训练后建立的模型。 0037 请参阅图3, 在一个实施例中, 所述将待识别的喉咙图像输入至第一喉咙识别模型 中进行识别, 并从待识别的喉咙图像中确定出喉咙图像的步骤, 包括: 0038 步骤S21: 将待识别的喉咙图像切分为多个同等大小的图像窗口。 0039 其中, 如果待识别的。

20、喉咙图像可为4000*3000像素的照片, 那么可以以2000*2000 像素作为图像窗口, 以10像素为步长滑动, 可得到399*299119301个同等大小的图像窗 口。 0040 步骤S22: 将各个所述图像窗口分别输入至第一喉咙识别模型中, 获得各个图像窗 口的喉咙分值。 0041 其中, 第一喉咙识别模型可为神经网络模型或者其他分类模型, 请参阅图4, 在一 个实施例中, 以神经网络为例, 通过喉咙样本图像和非喉咙样本图像进行训练建立第一喉 咙识别模型的步骤包括: 0042 步骤S221: 获取样本图像, 并将样本图像切分为多个同等大小的样本图像窗口。 0043 步骤S222: 对各。

21、个样本图像窗口标注分值。 0044 其中, 喉咙面积大小超过图像面积大小的2分之1为喉咙图像, 标注分值为1; 喉咙 面积大小超过图像面积大小的2分之1为非喉咙图像, 标注分值为0; 或者, 喉咙面积大小超 过图像面积大小的2分之1为喉咙图像, 标注分值为0; 喉咙面积大小超过图像面积大小的2 分之1为非喉咙图像, 标注分值为1。 0045 其中, 标注的分值大小可以根据需要进行修改, 但是一旦标注确定后, 则在整个系 统中表示的意义则不能再改变。 0046 步骤S223: 取一样本图像窗口输入至第一喉咙识别模型中, 获得该样本图像窗口 的识别结果, 并根据该样本图像窗口的识别结果与该样本图像。

22、窗口标注的分值, 计算第一 喉咙模型的设定代价函数值。 0047 步骤S224: 如果第一喉咙模型的设定代价函数值满足设定值, 则建立该第一喉咙 识别模型; 如果第一喉咙模型的设定代价函数值不满足设定值, 则更新第一喉咙识别模型, 说明书 3/8 页 6 CN 110148124 A 6 取下一样本图像, 回到步骤S223。 0048 所述第一喉咙识别模型的表示方式为: 0049 0050 其中, w和b为第一喉咙识别模型的参数, 是待训练的变量; x为第一喉咙识别模型 的输入, 在训练过程中, x为样本图像窗口, 在识别过程中, x为图像窗口; y为第一喉咙识别 模型的输出, 其为0至1之间。

23、的分值。 0051 所述第一喉咙识别模型中的参数的更新方式为: 0052计算各个参数的梯度 0053 更新各个参数ww- w,bb- b, 其中 是可调的更新步长, 比如设为0.1, 具 体最优设值需要根据具体的样本情况来判断。 参数更新的方法还有其他的, 比如ADAM算法 等, 不作限定。 0054 所述第一喉咙识别模型的代价函数为交叉熵函数, 其表示方式为: 0055 0056其中, 为步骤S222中对各个样本图像窗口标注的分值, y是第一喉咙识别模型输 出的样本图像窗口的识别结果。 0057 所述设定值可根据实际需要进行确定, 其确定原则是越小越好, 可以为L小到一定 程度或者不再下降,。

24、 则不再进行训练。 0058 步骤S23: 如果最高的喉咙分值超过第一设定阈值, 则将该最高的喉咙分值对应的 图像窗口作为喉咙图像。 0059 其中, 所述第一设定阈值可以根据实际需要的分类敏感度和准确度要求来设定。 阈值设得越高, 敏感度越低, 准确度越高; 阈值设得越低, 敏感度越高, 准确度越低。 其中, 敏 感度是指, 在所有是喉咙的样本里面, 分类器判定为喉咙的样本比例。 准确度是指, 在所有 分类器判定为喉咙的样本里面, 确实是喉咙的样本的比例。 具体的计算公式如下: 0060 0061 0062 步骤S24: 如果最高的喉咙分值超过第一设定阈值, 则提示该待识别的喉咙图像不 包括。

25、喉咙图像的信息。 0063 本公开不限定所述步骤SaSL的先后顺序, 也即, 在其他实施例中, 可根据所述步 骤S21S24之间的逻辑关系, 而适应性地调整所述步骤S21S24的执行顺序, 所述执行顺 序并不唯一, 例如, 步骤S23和步骤S24的位置可以互换。 0064 步骤S3: 将喉咙图像输入至第二喉咙识别模型中进行识别, 获得喉咙的状态分值; 其中, 所述第二喉咙识别模型为通过喉咙样本图像以及对应的喉咙的状态分值进行训练后 建立的模型。 0065 其中, 第二喉咙识别模型可为神经网络模型或者其他分类模型, 请参阅图5, 在一 说明书 4/8 页 7 CN 110148124 A 7 个。

26、实施例中, 通过根据喉咙样本图像以及对应的喉咙的状态分值进行训练建立第二喉咙识 别模型的步骤, 包括: 0066 步骤S31: 获取多个喉咙样本图像, 并对各个喉咙样本图像标注喉咙的状态分值。 0067 其中, 喉咙状态为正常的图像, 标注为1, 喉咙状态为异常的图像, 标注为0; 或者, 喉咙状态为正常的图像, 标注为0, 喉咙状态为异常的图像, 标注为1。 0068 其中, 标注的大小可以根据需要进行修改, 但是一旦标注确定后, 则在整个系统中 表示的意义则不能再改变。 0069 步骤S32: 取一喉咙样本图像输入至第二喉咙识别模型中, 获得第二喉咙识别模型 输出的喉咙样本图像的状态分值,。

27、 并根据第二喉咙识别模型输出的喉咙样本图像的状态分 值与表注的喉咙样本图像的状态分值, 计算第二喉咙模型的设定代价函数值。 0070 步骤S33: 如果第二喉咙模型的设定代价函数值满足设定值, 则建立该第二喉咙识 别模型; 如果第二喉咙模型的设定代价函数值不满足设定值, 则更新第二喉咙识别模型, 取 下一喉咙样本图像, 回到步骤S32。 0071 其中, 所述第二喉咙识别模型的表示方式为yf(F(x), 为一个复合函数, 其中f ()为分类器, 其表示方式、 参数的更新方式、 代价函数和设定值的确定与第一喉咙识别模 型相同, 这里不加以赘述。 F(x)是特征提取器集合, 其可包括多个特征提取器。

28、, 每个特征提 取器的表示方式为:其中, x是指从原图片中切出来的切片窗口即喉咙 样本图像的像素的矩阵向量, 比如原图为2000*2000像素, 喉咙样本图像的大小为5*5, 则x 为25维的向量,也是25维的向量,表示第i个特征提取器的参数, conv()为卷积函数, 表示对括号内的参数进行卷积运算; 表示第i个特征提取器。 0072 其中, 训练特征提取器的方式为: 确定喉咙图像的特征, 比如白斑点、 红斑点各为 一种图像特征, 选定这两种图像特征, 就有两个特征提取器; 然后从原图片中把含有白斑点 的窗口人工选定, 切片出来, 作为正样本; 其他没有白斑点的区域抽样一定的切片数量作为 负。

29、样本。 红斑点或者其他特征亦如此。 将正样本标注为1, 负样本标注为0, 然后对特征提取 器进行训练, 并通过结果预测方程对训练结果进行预测, 获得训 练后的特征提取器, 进而确定各个特征提取器的值。 结果预测方程中的表示第i个特 征提取器的结果预测方程的权重参数; 表示第i个特征提取器; b2表示结果预测方程的偏 置参数。 其中, 特征提取器的训练过程中的参数的更新方式和设定值的确定与第一喉咙识 别模型相同, 这里不加以赘述。 0073 当各个特征提取器确定后, 通过各个特征提取器分别对喉咙样本图像进行卷积运 算, 获得该多个特征提取器对应的喉咙样本图像的特征集合, 再将该特征集合前后拼接作。

30、 为分类器的输入, 实现对喉咙样本图像的分类, 从而提高分类器的准确性。 在本实施例中, 在训练特征提取器时, 选定了一图像特征, 通过将图像特征如白斑点从训练样本图像中切 分出来作为训练正样本, 其他没有图像特征的作为训练负样本, 以实现对特征提取器的训 练, 进而通过该特征提取器对喉咙图像进行特征提取时, 只提取喉咙图像中的图像特征, 从 而使得分类器可根据图像特征实现快速准确分类, 提高分类器的准确性。 0074 在一个实施中, 步骤S3中将喉咙图像输入至第二喉咙识别模型中进行识别, 获得 说明书 5/8 页 8 CN 110148124 A 8 喉咙的状态分值的步骤之后, 还包括: 如。

31、果喉咙的状态分值超过第二设定阈值, 则提示喉咙 为异常的信息; 如果喉咙的状态分值没有超过第二设定阈值, 则提示喉咙为正常的信息。 0075 请参阅图6, 在一个更优的实施例中, 为使得获得的喉咙图像更加完整和清晰, 在 步骤S2中将待识别的喉咙图像输入至第一喉咙识别模型中进行识别, 并从待识别的喉咙图 像中确定出喉咙图像之后, 还包括调整待识别的喉咙图像的方法, 具体如下步骤: 0076 步骤S2a: 获取喉咙图像的坐标信息。 0077 步骤S2b: 根据所述喉咙图像的坐标信息, 计算喉咙图像的中心坐标。 0078 其中, 喉咙图像的坐标信息为(x, y, w, h); x, y代表喉咙窗口。

32、左上角的坐标; w, h代 表窗口的宽度、 高度; 则喉咙图像的中心坐标为(x+w/2, y+h/2)。 0079 步骤S2c: 如果喉咙图像的中心坐标中的横坐标在设定的横坐标范围内, 且喉咙图 像的中心坐标中的横坐标在设定的纵坐标范围内, 则跳到步骤S3。 0080 其中, 所述设定的横坐标范围为与待识别喉咙图像的中心坐标中的横坐标的差值 的绝对值小于横坐标的设定阈值的坐标, 例如, 如果喉咙图像的中心坐标中的横坐标为 1500, 横坐标的设定阈值为500, 则所述设定的横坐标范围为1000至2000。 所述设定的纵坐 标范围为与待识别喉咙图像的中心坐标中的纵坐标的差值的绝对值小于纵坐标的设。

33、定阈 值的坐标, 例如, 如果喉咙图像的中心坐标中的纵坐标为1600, 纵坐标的设定阈值为500, 则 所述设定的纵坐标范围为1100至2100。 0081 步骤S2d: 如果喉咙图像的中心坐标中的横坐标不在设定的横坐标范围内, 则如果 喉咙图像的中心坐标中的横坐标与设定的横坐标的差值小于0, 则提示获取待识别的喉咙 图像的摄像装置11向左移动; 如果喉咙图像的中心坐标中的横坐标与设定的横坐标的差值 大于0, 则提示获取待识别的喉咙图像的摄像装置11向右移动, 回到步骤S2。 0082 步骤S2e: 如果喉咙图像的中心坐标中的横坐标在设定的横坐标范围内, 但喉咙图 像的中心坐标中的纵坐标不在设。

34、定的纵坐标范围内, 则如果喉咙图像的中心坐标中的纵坐 标与设定的纵坐标的差值小于0, 则提示获取待识别的喉咙图像的摄像装置11向上移动; 如 果喉咙图像的中心坐标中的纵坐标与设定的纵坐标的差值大于0, 则提示获取待识别的喉 咙图像的摄像装置11向下移动; 回到步骤S2。 0083 本公开实施例发现通过拍摄获取待识别的喉咙图像, 再通过第一喉咙识别模型和 第二喉咙识别模型对待识别的喉咙图像进行识别, 从而获得喉咙的状态分值, 进而使用户 无需依赖他人和专业人群, 即可方便快捷地获悉喉咙的状态。 0084 请参阅图8, 与前述喉咙识别方法的实施例对应, 本公开还提供了一种喉咙识别装 置20, 应用。

35、于终端中, 包括: 0085 图像获取模块21, 用于获取待识别的喉咙图像; 0086 喉咙图像确定模块22, 用于将待识别的喉咙图像输入至第一喉咙识别模型中进行 识别, 并从待识别的喉咙图像中确定出喉咙图像; 其中, 所述第一喉咙识别模型为通过喉咙 样本图像和非喉咙样本图像进行训练后建立的模型; 0087 状态分值确定模块23, 用于将喉咙图像输入至第二喉咙识别模型中进行识别, 获 得喉咙的状态分值; 其中, 所述第二喉咙识别模型为通过喉咙样本图像以及对应的喉咙的 状态分值进行训练后建立的模型。 0088 在一个实施例中, 所述喉咙图像确定模块22包括: 说明书 6/8 页 9 CN 110。

36、148124 A 9 0089 切分模块221, 用于将待识别的喉咙图像切分为多个同等大小的图像窗口。 0090 喉咙分值确定模块222, 用于将各个所述图像窗口分别输入至第一喉咙识别模型 中, 获得各个图像窗口的喉咙分值。 0091 喉咙图像确定模块223, 用于如果最高的喉咙分值超过第一设定阈值, 则将该最高 的喉咙分值对应的图像窗口作为喉咙图像。 0092 提示模块224, 用于如果最高的喉咙分值超过第一设定阈值, 则提示该待识别的喉 咙图像不包括喉咙图像的信息。 0093 在一个实施中, 本公开的喉咙识别装置还包括状态提示模块(图中未示), 用于如 果喉咙的状态分值超过第二设定阈值, 。

37、则提示喉咙为异常的信息; 如果喉咙的状态分值没 有超过第二设定阈值, 则提示喉咙为正常的信息。 0094 请参阅图9, 在一个更优的实施例中, 为使得获得的喉咙图像更加完整和清晰, 本 公开的喉咙识别装置还包括图像调整模块25, 所述图像调整模块25包括: 0095 坐标信息获取模块251, 用于获取喉咙图像的坐标信息。 0096 中心坐标计算模块252, 用于根据所述喉咙图像的坐标信息, 计算喉咙图像的中心 坐标。 0097 跳转模块253, 用于如果喉咙图像的中心坐标中的横坐标在设定的横坐标范围内, 且喉咙图像的中心坐标中的横坐标在设定的纵坐标范围内, 则将喉咙图像输入至第二喉咙 识别模型。

38、中进行识别, 获得喉咙的状态分值。 0098 第一移动提示模块254, 用于如果喉咙图像的中心坐标中的横坐标不在设定的横 坐标范围内, 则如果喉咙图像的中心坐标中的横坐标与设定的横坐标的差值小于0, 则提示 获取待识别的喉咙图像的摄像装置11向左移动; 如果喉咙图像的中心坐标中的横坐标与设 定的横坐标的差值大于0, 则提示获取待识别的喉咙图像的摄像装置11向右移动, 则将待识 别的喉咙图像输入至第一喉咙识别模型中进行识别, 并从待识别的喉咙图像中确定出喉咙 图像。 0099 第二移动提示模块255, 用于如果喉咙图像的中心坐标中的横坐标在设定的横坐 标范围内, 但喉咙图像的中心坐标中的纵坐标不。

39、在设定的纵坐标范围内, 则如果喉咙图像 的中心坐标中的纵坐标与设定的纵坐标的差值小于0, 则提示获取待识别的喉咙图像的摄 像装置11向上移动; 如果喉咙图像的中心坐标中的纵坐标与设定的纵坐标的差值大于0, 则 提示获取待识别的喉咙图像的摄像装置11向下移动; 则将待识别的喉咙图像输入至第一喉 咙识别模型中进行识别, 并从待识别的喉咙图像中确定出喉咙图像。 0100 本公开还提供一种计算机可读存储介质, 其上储存有计算机程序, 该计算机程序 被处理器执行时实现如上述方法中对应步骤的实现过程, 在此不再赘述。 0101 本公开可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘 存储器。

40、、 CD-ROM、 光学存储器等)上实施的计算机程序产品的形式。 计算机可读储存介质包 括永久性和非永久性、 可移动和非可移动媒体, 可以由任何方法或技术来实现信息存储。 信 息可以是计算机可读指令、 数据结构、 程序的模块或其他数据。 计算机的存储介质的例子包 括但不限于: 相变内存(PRAM)、 静态随机存取存储器(SRAM)、 动态随机存取存储器(DRAM)、 其他类型的随机存取存储器(RAM)、 只读存储器(ROM)、 电可擦除可编程只读存储器 (EEPROM)、 快闪记忆体或其他内存技术、 只读光盘只读存储器(CD-ROM)、 数字多功能光盘 说明书 7/8 页 10 CN 1101。

41、48124 A 10 (DVD)或其他光学存储、 磁盒式磁带, 磁带磁磁盘存储或其他磁性存储设备或任何其他非传 输介质, 可用于存储可以被计算设备访问的信息。 0102 本公开还提供一种计算机设备, 包括储存器、 处理器以及储存在所述储存器中并 可被所述处理器执行的计算机程序, 所述处理器执行所述计算机程序时实现上述方法中对 应步骤的实现过程, 在此不再赘述。 0103 本公开还提供一种喉咙识别设备, 包括摄像装置11和图像处理装置12, 所述摄像 装置11用于拍摄待识别的喉咙图像, 所述图像处理装置12用于实现上述方法中对应步骤的 实现过程, 在此不再赘述。 0104 其中, 摄像装置11和。

42、图像处理装置12可以集成于同一终端设备内, 例如该终端设 备可为带摄像头的手机、 带摄像头的ipad、 带摄像头的电脑等终端设备, 这些终端设备内可 安装有图像处理应用, 进而可对拍摄的待识别的喉咙图像进行识别处理, 获得喉咙的状态 分值。 摄像装置11和图像处理装置12也可以不集成于同一终端设备内, 例如通过相机对着 人的喉咙进行拍摄, 获得拍摄的待识别的喉咙图像, 再传送到手机、 ipad、 电脑等设备, 由手 机、 ipad、 电脑安装的图像处理应用, 对待识别的喉咙图像进行识别处理, 获得喉咙的状态 分值。 0105 以上所述实施例仅表达了本发明的几种实施方式, 其描述较为具体和详细,。

43、 但并 不能因此而理解为对发明专利范围的限制。 应当指出的是, 对于本领域的普通技术人员来 说, 在不脱离本发明构思的前提下, 还可以做出如果干变形和改进, 这些都属于本发明的保 护范围。 说明书 8/8 页 11 CN 110148124 A 11 图1 图2 说明书附图 1/5 页 12 CN 110148124 A 12 图3 图4 说明书附图 2/5 页 13 CN 110148124 A 13 图5 图6 说明书附图 3/5 页 14 CN 110148124 A 14 图7 图8 说明书附图 4/5 页 15 CN 110148124 A 15 图9 说明书附图 5/5 页 16 CN 110148124 A 16 。

展开阅读全文
内容关键字: 喉咙 识别 方法 装置 系统 存储 介质 以及 设备
关于本文
本文标题:喉咙识别方法、装置、系统、存储介质以及设备.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11349045.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1