陶智

姓名: 陶智

部门：直播

联系方式：0512-67870162，电子邮箱：[email protected]

个人简历： 博士、教授、博导

研究领域：

1、振动测试与信号处理、状态监测与智能诊断

声信号处理、故障诊断与检测、生物医学信息检测和处理

2、信息感知与智能计算

图像识别和处理算法、机器视觉、人工智能和机器学习核心算法

3、工业互联网技术

智能感知传感设备、边缘计算、数字孪生、工业互联网智能化平台和管理系统

学术任职和成果:

现担任中国生物医学物理研究会理事、全国声标准委员会委员、江苏省声学学会理事、江苏省仪器仪表学会理事、江苏省生物医学信号检测与处理委员会副主任委员等。主持国家自然科学基金项目、江苏省产学研前瞻性联合研究项目、太仓创新创业人才、苏州市低碳中心项目及产学研项目多项。在国内期刊上公开发表论文100余篇（其中，SCI（EI）检索论文40余篇），授权各类专利70余项，其中发明专利26项。参与制定国家标准2项。主持江苏省研究生教改项目1项（已结题），作为负责人获批江苏省一流本科课程（虚拟仿真实验）。

科研项目：

[1] 国家自然科学基金面上项目“病理嗓音细分中声带分层流固耦合振动机理研究”，2025.1-2028.12

[2] 国家自然科学基金面上项目“病理嗓音识别及嘶哑嗓音修复研究”

[3] 江苏省产学研前瞻性联合研究项目“太阳能光伏逆变器及高效并网逆变技术研发”

[4] 江苏省产学研前瞻性联合研究项目“雷电直接效应试验测试技术研究”

[5] 苏州市低碳中心项目“家用太阳能发电及照明系统相关技术项目”

[6] 太仓创新创业领军人才计划项目“高效光伏并网逆变技术”

[7] 江苏华航威泰机器人科技有限公司产学研合作项目“双碳节能边缘计算关键技术研究”

[8] 苏州汤普斯安防科技有限公司产学研合作项目“校园智慧锁云控制系统研发”

[9] 苏州科特环保股份有限公司产学研合作项目“基于超声波工业污水在线COD检测研究”

[10] 上海伟臣楷徳科技有限公司产学研合作项目“无损检测缺陷智能化识别技术研究”

代表论文：

[1] Zhiyuan Dai , Yuyang Jiang , Laiyuan Cao , Xiaojun Zhang*，Zhi Tao*，MSDFEN: Multi-scale dynamic feature extraction network for pathological voice detection，Applied Acoustics, 2025, 230:110438

[2] Xin-Cheng Zhu , Hong Zhang , Hui-Tao Feng , Deng-Huang Zhao , Xiao-Jun Zhang* , Zhi Tao*, IFAN: An Icosahedral Feature Attention Network for Sound Source Localization, IEEE Transactions on Instrumentation and Measurement, 2024, 73:2505913

[3] Denghuang Zhao , Zhixin Qiu , Yujie Jiang , Xincheng Zhu , Xiaojun Zhang *, Zhi Tao *,A depthwise separable CNN-based interpretable feature extraction network for automatic pathological voice detection, 2024, 88:105624

[4] Zhi-xin Qiu, Jian-wei Niu, Zhan-xu Shen, Yu-xuan Yang, Shu-ju Zhang, Xiao-jun Zhang*, Zhi Tao*,A Study of Icosahedral Feature Sound Source Localization Method with Hybrid Dilation Convolution, IAENG International Journal of Computer Science, 2024,51(12):1950-1959

[5] Minghang Chu,Mengtao Yang,Chao Xu,Yaoyao Ma,Jing Wang,Zhiwei Fan,Zhi Tao*,Di Wu*, E-DGAN: An Encoder-Decoder Generative Adversarial Network Based Method for Pathological to Normal Voice Conversion, IEEE Journal of Biomedical and Health Informatics, 2023, 27(5):2489-2500.

[6] Xiaojun Zhang, Xincheng Zhu, Changwei Zhou,Zhi Tao*, Heming Zhao,Pathological voice classification based on the features of an asymmetric fluid–structure interaction vocal cord mode, Applied Acoustics, 2023, 207: 109348.

[7] Jinyang Qian, Yihua Zhang, Denghuang Zhao, Xiaojun Zhang, Yishen Xu*, Zhi Tao*,Investigation of Vowel Generation Method in Low-resource Pathological Voice Database, Engineering Letters,2023,31(1):399-412.

[8] Xiaojun Zhang,Changwei Zhou,Xincheng Zhu,Zhi Tao*,Heming Zhao,Class-imbalanced voice pathology classification: Combining hybrid sampling with optimal two-factor random forests, Applied Acoustics, 2022, 190: 108618.

[9] Changwei Zhou,Yuanbo Wu,Ziqi Fan,Xiaojun Zhang,Di Wu*, Zhi Tao*,Gammatone spectral latitude features extraction for pathological voice detection and classification, Applied Acoustics, 2022, 185:108417.

[10] Zhang, Y., Qian, J., Zhang,X., Xu, Y.*, Tao, Z*, Pathological Voice Detection Using Joint Subsapce Transfer Learning. Appl. Sci. 2022, 12, 8129.

[11] Zhu, X.-C., Zhao, D.-H., Zhang, Y.-H., Zhang, X.-J*., Tao, Z*, Multi-Scale Recurrence Quantification Measurements for Voice Disorder Detection. Appl. Sci. 2022, 12, 9196.

[12] 赵登煌, 周长伟, 朱欣程, 张晓俊*, 陶智*. gammatone短时谱自相似度的病理嗓音检测. 生物医学工程学杂志, 2022, 39(4): 694-701.

[13] Y. Wu, C. Zhou, Z. Fan, D. Wu, X. Zhang*, Z. Tao*, Investigation and Evaluation of Glottal Flow Waveform for Voice Pathology Detection,IEEE Access, 2021,9:30-44.

[14] Fan Z, Wu Y, Zhou C, Zhang X*, Tao Z*,Class-Imbalanced Voice Pathology Detection and Classification Using Fuzzy Cluster Oversampling Method,Applied Sciences, 2021,11(8):3450.

[15] Zhou C , Zhang L , Wu Y , Zhang X , Tao Z*,Effects of Sulcus Vocalis Depth on Phonation in Three-Dimensional Fluid-Structure Interaction Laryngeal Models, Applied Bionics and Biomechanics, 2021, 2021:1-11.

[16] Xiao-Jun Zhang, Xin-Cheng Zhu, Di Wu, Zhong-Zhe Xiao, Zhi Tao*, He-Ming Zhao, Nonlinear Features of Bark Wavelet Sub-band Filtering for Pathological Voice Recognition, Engineering Letters, 2021,29(1):49-60.

[17] Xiaojun Zhang, Yan Wang, Wei Zhao, Wei Wei, Zhi Tao*, Heming Zhao , Vocal cord abnormal voice flow field study by modeling a bionic vocal system,Advanced Robotics,2020, 34(1):28-36.

[18] Zhao Wei, Chu Hongchen, Hang Zhi Hong*,Tao Zhi*,Acoustic transmissive cloaking using zero-index materials and metasurfaces, Applied Physics Express,2019,12(5): 054004.

[19] 陈莉媛,薛隆基,曾晓亮,张莉丽,孙宝印,张晓俊*,陶智*.非对称黏性空气动力学声带模型及其病理喉声源分类,声学学报,2020,45(05):759-769.

[20] Zhang X, Gu L, Wei W, Wu D, Tao Z*, Zhao H, Pathological Voice Source Analysis System Using a Flow Waveform-Matched Biomechanical Model. Applied Bionics and Biomechanics,2018(1):1-13.

[21] Wei Zhao,Yuting Yang,Zhi Tao*,Zhi Hong Hang*,Tunable Transmission and Deterministic Interface states in Double-zero-index Acoustic Metamaterials,Scientific Reports, 2018, 8(1):6311.

[22] 曾晓亮,张晓俊,吴迪,邵雅婷,陶智*.利用声带动力学模型参数反演方法进行病变嗓音分类,声学学报,2018,43(01):91-100.

[23] Xiao-Jun Zhang, Yi Cao, Wen-Ye Sun, He-Ming Zhao, Di Wu, Zhi Tao*, Improved Mandarin Chinese Perception for Cochlear Implants Using an Auditory Model based on Stochastic Stimulation,Engineering Letters, 2016,24(1):38-44.

[24] 顾玲玲,张晓俊*,黄程韦,吴迪,周孝进,陶智*,息肉与麻痹喉声源分类中非线性动力学发声系统模型研究,声学学报,2015,40(6):878-885.

[25] 周强,张晓俊,顾济华,赵鹤鸣,朱俊杰,陶智*,嗓音多频带非线性分析的声带病变识别,声学学报,2014,39(1):111-118.

[26] Z.Tao,H.M.Zhao,D.Wu,D.Q.Chen,X.J.Zhang,A Method of Whispered Speech Enhancement Based on Speech Absence Probability and Modified Mel-domain Masking Model,Chinese Journal of Acoustics,2011, 30(3),pp:345-357.

[27] Z.Tao,H.M.Zhao,X.D.Tan,X.J.Zhang, Di Wu,Speech enhancement based on the multi-scales and multi-thresholds of auditory perception wavelet transform,Archives of Acoustics, 2011,36(3):519-532.

[28] 陶智,赵鹤鸣,吴俊,吴迪,张晓俊,许宜申,提升小波变换和混沌加密的数字声频水印,声学学报,2011,36(6):665-674.

[29] Z.Tao,H.M.Zhao,J.Wu, J.H.Gu,Y.S.Xu, D.Wu. A lifting wavelet domain audio watermarking algorithm based on the statistical characteristics of sub-band coefficients,Archives of Acoustics,2010,35(4):481-491.

[30] 陶智,赵鹤鸣,吴迪,陈大庆,张晓俊,基于修正 Mel 域掩蔽模型和无语音概率的耳语音增强,声学学报,2009,34(4):370-377.

[31] Z.Tao, H.M.Zhao, J.H.Gu, D.Wu,Audio watermarking based on psychoacoustic model and critical band wavelet transform,Chinese Journal of Acoustics,2007,27(1):63-72.

[32] 陶智,赵鹤鸣,顾济华,吴迪,基于心理声学模型和临界频带子波变换的数字声频水印,声学学报,2006,31(2):114-119.

授权发明专利：

[1] 张晓俊,周嘉成,姜余杰,邱志昕,黄嘉敏,陶智. 一种语音播报药盒识别装置及药盒识别方法[P].CN116168376B,2023-07-18.

[2] 张晓俊,章溢华,钱金阳,许宜申,陶智. 一种面向语音识别的特征迁移学习方法及系统[P]. CN114997266B,2023-07-11.

[3] 孙宝印,陶智,陈莉媛,张晓俊,吴迪,肖仲喆. 一种利用声带建模反演的嗓音分类方法[P]. CN109119094B,2023-04-28.

[4] 陶智,钱金阳,章溢华,张晓俊,许宜申. 小样本不均衡语音数据库的生成式数据增强方法及系统[P]. CN114548221B,2023-04-28.

[5] 陶智,伍远博,孙宝印,张晓俊,周长伟,范子琦. 一种基于声门波信息的语音识别方法[P]. CN112735386B,2023-03-24.

[6] 吴迪,楚明航,杨梦涛,马瑶瑶,王靖,徐超,范智玮,张晓俊,陶智. 针对病理嗓音的语音转换方法、装置和存储介质[P]. CN115294970B,2023-03-24.

[7] 陶智,周长伟,吴迪,伍远博,范子琦. 基于感知谱收敛率的语音识别方法[P]. CN112863517B,2023-01-06.

[8] 张晓俊,周长伟,朱欣程,陶智,赵鹤鸣. 一种联合混合采样和随机森林的语音样本均衡方法[P].CN114550697B,2022-11-18.

[9] 吴迪,朱涛,杨勇,高恬曼,黄玉玲,陶昕辰,张晓俊,陶智. 基于四焦距相位相干机器视觉的晶体缺陷检测方法和系统[P]. CN114820617B,2022-09-20.

[10] 肖仲喆,黄敏,陶智. 双子空间特征迁移学习方法[P]. CN110163272B,2022-04-05.

[11] 肖仲喆,陶智,陈颖,张晓俊,吴迪,孙宝印. 一种体现情感细节信息的情感语料库构建方法[P]. CN109509486B,2021-04-09.

[12] 陶智,孙宝印,邵雅婷,张晓俊,吴迪,肖仲喆. 一种在声门闭相下估计声道面积的方法[P]. CN108133713B,2020-10-02.

[13] 肖仲喆,陶智,陈颖,张晓俊,吴迪. 一种高情感区分度的语音特征提取方法[P].CN107564543B,2020-06-26.

[14] 常静雅,陶智,张晓俊,赵鹤鸣,顾济华,吴迪. 一种语音识别方法[P]. CN106297768B,2020-01-17.

[15] 吴迪,陶智,赵鹤鸣,肖仲喆,张晓俊. 感知语谱规整耳蜗滤波系数的说话人识别特征提取方法[P].CN106653004B,2019-07-26.

[16] 陈鹏,于辉,黄学军,陶智. 高频衰减振荡波电压发生器[P]. CN105790716B,2018-12-21.

[17] 孙焕,陶智,张晓俊,吴迪,孙宝印. 一种NFC手机电子锁门禁装置系统[P]. CN104778768B,2017-07-28.

[18] 吴迪,赵鹤鸣,陶智. 采用感知语谱结构边界参数的语音端点检测算法[P]. CN104091593B,2017-02-15.

[19] 周皓,顾济华,陶智,李晨,徐静梅,李慧姝,张庆. 一种实时三维显示装置及显示方法[P]. CN102591123B,2014-12-10.

[20] 许宜申,顾济华,陶智,吴迪. 一种薄膜太阳能电池[P]. CN102637752B,2014-12-10.

[21] 张晓俊,何建龙,姜杏辉,倪赛华,陶智,顾济华,许宜申. 串联蓄电池组充放电控制系统及充放电优化方法[P]. CN102842937B,2014-11-19.

[22] 智永军,陶智,张晓俊,孔荣,姜杏辉. 游艇及其供电系统[P]. CN102514698B,2014-07-23.

[23] 张晓俊,陶智,肖仲喆,吴迪,季晶晶. 一种语音识别中的特征参数提取方法[P]. CN102646415B,2014-07-23.

[24] 陶智,吴迪,邵名巍,张晓俊,许宜申,季晶晶. 基于人工神经网络的智能路灯节能控制系统[P]. CN102413605B,2013-12-04.

[25] 陶智,顾济华,赵鹤鸣,吴俊. 用于声频文件的数字水印制作及识别方法[P]. CN101345054B,2011-11-23.

[26] 陶智,赵鹤鸣,顾济华,韩韬,陈大庆,许宜申,吴迪,张晓俊. 基于径向基神经网络的耳语音转换为正常语音的方法[P]. CN101527141B,2011-06-22.