^
Fact-checked
х

Ang lahat ng nilalaman ng iLive ay medikal na nasuri o naka-check ang katotohanan upang masiguro ang mas tumpak na katumpakan hangga't maaari.

Mayroon kaming mahigpit na mga panuntunan sa pag-uukulan at nag-uugnay lamang sa mga kagalang-galang na mga site ng media, mga institusyong pang-akademikong pananaliksik at, hangga't maaari, ang mga pag-aaral ng medikal na pag-aaral. Tandaan na ang mga numero sa panaklong ([1], [2], atbp) ay maaaring i-click na mga link sa mga pag-aaral na ito.

Kung sa tingin mo na ang alinman sa aming nilalaman ay hindi tumpak, hindi napapanahon, o kung hindi pinag-uusapan, mangyaring piliin ito at pindutin ang Ctrl + Enter.

Boses bilang Pagsusuri: Mga Maagang Signal ng Cancer at Benign Lesion

Alexey Kryvenko, Tagasuri ng Medikal
Huling nasuri: 18.08.2025
2025-08-12 08:13
">

Sinuri ng mga mananaliksik mula sa Oregon Health & Science University ang mga speech recording mula sa bagong available na publikong Bridge2AI-Voice dataset at nakahanap ng simpleng acoustic feature na maaaring magbunyag ng vocal fold pathology. Pinag-uusapan natin ang harmonics-to-noise ratio (HNR) — ang ratio ng "musical overtones" sa ingay. Ang antas at pagkakaiba-iba nito ay nakikilala ang mga tinig ng mga taong may kanser sa laryngeal at mga benign lesyon mula sa mga malusog at ilang iba pang mga karamdaman sa boses. Ang epekto ay lalong maliwanag sa mga lalaking cisgender; hindi sapat ang istatistikal na kahalagahan para sa mga kababaihan - sinisisi ng mga may-akda ang maliit na sukat ng sample at nanawagan para sa pagpapalawak ng data. Ang gawain ay nai-publish bilang isang maikling ulat sa Frontiers sa Digital Health.

Background ng pag-aaral

  • Bakit maghanap ng mga "voice marker" sa lahat. Ang pamamaos ay isang karaniwang reklamo. Ang mga sanhi ay iba-iba: mula sa sipon at reflux hanggang sa nodules/polyps at laryngeal cancer. Sa kasalukuyan, ang landas sa diagnosis ay isang pagbisita sa isang ENT specialist at isang endoscopy (isang camera sa ilong/lalamunan). Ito ay tumpak, ngunit hindi palaging mabilis na magagamit at hindi angkop para sa pagsubaybay sa sarili sa bahay. Kailangan ang pre-screening: isang simpleng paraan para maunawaan kung sino ang dapat magpatingin muna sa doktor.
  • Ano ang voice biomarker? Ang pananalita ay isang senyales na madaling ma-record sa isang telepono. Ang "pattern" nito ay maaaring gamitin upang hatulan kung paano nag-vibrate ang vocal folds. Ang mga sugat ay gumagawa ng mga panginginig ng boses na hindi pantay: mas maraming "ingay" at mas kaunting "musika".
  • Bakit mahalaga ang mga bagong dataset. Noong nakaraan, ang gayong mga gawa ay umaasa sa maliliit, "homemade" na mga sample - ang mga modelo ay marupok. Ang Bridge2AI-Voice ay isang malaking, multi-center, etikal na kinokolektang hanay ng mga audio recording na naka-link sa mga diagnosis. Ginawa ito bilang isang "pangkaraniwang lugar ng pagsubok" upang sa wakas ay sanayin at subukan ang mga algorithm sa malaki at magkakaibang data.
  • Nasaan ang mga pangunahing paghihirap?
    • Nagbabago ang boses dahil sa mikropono, ingay sa silid, lamig, paninigarilyo, wika, kasarian at edad.
    • May tradisyonal na mas kaunting data ng babae, at ang boses ng babae ay mas mataas sa dalas - iba ang pagkilos ng mga sukatan.
    • Walang pagsusulit na "tahanan" ang maaaring palitan ang isang pagsusuri o gumawa ng diagnosis - higit sa lahat, nakakatulong itong magpasya: "kailangan bang agarang magpatingin sa isang espesyalista sa ENT?"
  • Bakit kailangan ito ng klinika at mga pasyente? Kung ang mga taong may mataas na panganib ng mga node/tumor ay maaaring mapili para sa isang priority appointment sa pamamagitan ng isang maikling appointment, ito ay magpapabilis ng mga diagnostic, mabawasan ang mga hindi kinakailangang referral at magbigay ng isang tool para sa self-monitoring sa pagitan ng mga pagbisita (pagkatapos ng operasyon, sa panahon ng therapy).
  • Kung saan ito dapat humantong: Upang ma-validate ang mga aplikasyon/modules ng telemedicine na:
    1. sumulat ng talumpati ayon sa pamantayan (parirala + iginuhit na “aaa”),
    2. kalkulahin ang mga pangunahing tampok (HNR, jitter, shimmer, F0),
    3. mag-isyu ng rekomendasyon na makipag-ugnayan sa isang espesyalista kung nakakaalarma ang profile,
    4. mapanatili ang dynamics pagkatapos ng paggamot.

Ang ideya ay simple: "ibigay ang telepono sa tainga ng isang doktor ng ENT" - hindi para sa pagsusuri, ngunit upang hindi makaligtaan ang mga nangangailangan ng mabilis na harapang tulong.

Ano nga ba ang ginawa nila?

  • Kinuha namin ang unang release ng multi-center, etikal na kinolekta ang Bridge2AI-Voice dataset, isang flagship na proyekto ng NIH kung saan ang mga voice recording ay naka-link sa klinikal na impormasyon (mga diagnosis, questionnaire, atbp.).
  • Dalawang analytical sample ang nabuo:
    1. "kanser sa laryngeal / benign node / malusog";
    2. "cancer o benign nodules" laban sa spasmodic dysphonia at vocal fold paralysis (iba pang karaniwang sanhi ng pamamalat).
  • Natukoy ang mga pangunahing feature ng boses mula sa mga standardized na parirala: basic tone (F0), jitter, shimmer, at HNR, at ang mga grupo ay inihambing gamit ang nonparametric statistics. Resulta: ang pinaka-matatag na pagkakaiba ay nasa HNR at F0, kasama ang HNR at ang pagkakaiba-iba nito na pinakamahusay na naghihiwalay sa mga benign lesyon mula sa parehong norm at laryngeal cancer. Ang mga senyas na ito ay mas naiiba sa mga lalaki.

Bakit ito mahalaga?

  • Maagang screening nang walang probe. Sa kasalukuyan, ang landas sa diagnosis ay kadalasang nangangahulugan ng nasoendoscopy at, kung pinaghihinalaang, biopsy. Kung ang mga simpleng acoustic feature na sinamahan ng AI ay maaaring unahin ang mga nangangailangan ng endoscopy, ang mga pasyente ay makakarating sa isang ENT specialist nang mas maaga at ang mga hindi kinakailangang referral ay mababawasan. Ito ay pandagdag, hindi kapalit ng doktor.
  • Malaking data para sa boses. Ang Bridge2AI-Voice ay isang bihirang proyekto kung saan kinokolekta ang boses gamit ang magkakatulad na mga protocol at naka-link sa mga diagnosis; ang data ay magagamit sa mga mananaliksik sa pamamagitan ng PhysioNet / Health Data Nexus. Pinapabilis nito ang pagbuo ng mga maaasahang biomarker ng boses sa halip na "mga himalang app" sa maliliit na sample.

Ano ang HNR?

Kapag nagsasalita tayo, ang vocal folds ay nag-vibrate at lumilikha ng mga overtones (harmonics). Ngunit ang panginginig ng boses ay hindi perpekto - palaging may ingay sa signal. Ang HNR ay kung gaano karaming "musika" ang nasa boses kaysa sa "hiss". Kapag nasira ang mga fold, nagiging mas kaunti ang vibration - mas maraming ingay, bumababa ang HNR, at tumataas ang mga pagtalon nito (variability). Ito ang pattern na nakuha ng mga may-akda.

Mahahalagang Disclaimer

  • Ito ay isang pilot, exploratory analysis: nang walang clinical validation, na may mga paghihigpit sa sample ng mga kababaihan - kaya ang kanilang mga epekto ay hindi makabuluhan. Ang mas malaki at mas magkakaibang data at "pagihaw" ng mga modelo sa iba't ibang klinika at sa iba't ibang wika ay kailangan.
  • Ang boses ay isang "multi-valued" na bagay: ito ay apektado ng malamig, paninigarilyo, reflux, mikropono, ingay sa silid. Ang anumang "pagsusuri sa bahay" ay dapat na maisaalang-alang ang konteksto - at nagsisilbi pa rin bilang isang filter para sa isang referral sa isang espesyalista sa ENT, at hindi isang click-through na diagnosis.

Ano ang susunod?

  • Palawakin ang dataset (kabilang ang para sa mga kababaihan at edad), i-standardize ang mga gawain at acoustics (pagbabasa ng parirala, matagal na "aaa", atbp.), subukan ang mga multimodal na modelo (mga sintomas ng boses + questionnaire/mga kadahilanan sa peligro).
  • I-link ang mga acoustic sign sa mga resulta ng pagsusuri (endoscopy, stroboscopy) at dynamics pagkatapos ng paggamot - upang magamit din ang HNR profile para sa pagsubaybay.
  • Ipagpatuloy ang “open science”: Ang Bridge2AI-Voice ay nagpa-publish na ng mga bersyon ng dataset at mga tool - isa itong pagkakataon upang mabilis na maabot ang mga tunay na piloto sa mga klinika.

Konklusyon

Posibleng "makarinig" ng mga problema sa vocal fold mula sa boses - at marahil ay i-refer ang tao sa tamang espesyalista nang mas maaga. Sa ngayon, ito ay isang magandang palatandaan (HNR at ang pagkakaiba-iba nito), ngunit salamat sa malaking bukas na data, ang mga voice biomarker sa wakas ay may pagkakataon na maging isang maaasahang tool sa pag-screen.

Pinagmulan: Jenkins P. et al. Boses bilang isang Biomarker: Pagsusuri ng Paggalugad para sa mga Benign at Malignant Vocal Fold Lesion. Frontiers in Digital Health, 2025 (tinanggap para sa publikasyon). Data — Bridge2AI-Voice (NIH/PhysioNet).


Ang iLive portal ay hindi nagbibigay ng medikal na payo, diagnosis o paggamot.
Ang impormasyong inilathala sa portal ay para sa reference lamang at hindi dapat gamitin nang walang pagkonsulta sa isang espesyalista.
Maingat na basahin ang mga alituntunin at patakaran ng site. Maaari mo ring makipag-ugnay sa amin!

Copyright © 2011 - 2025 iLive. Lahat ng karapatan ay nakalaan.