Visión artificial en cirugía: del potencial al valor clínico
HogarHogar > Blog > Visión artificial en cirugía: del potencial al valor clínico

Visión artificial en cirugía: del potencial al valor clínico

May 27, 2023

npj Digital Medicine volumen 5, Número de artículo: 163 (2022) Citar este artículo

4636 Accesos

4 citas

26 Altmetric

Detalles de métricas

Cada año se realizan cientos de millones de operaciones en todo el mundo, y la creciente aceptación de la cirugía mínimamente invasiva ha permitido que las cámaras de fibra óptica y los robots se conviertan en herramientas importantes para realizar cirugías y sensores desde los cuales capturar información sobre la cirugía. La visión por computadora (CV), la aplicación de algoritmos para analizar e interpretar datos visuales, se ha convertido en una tecnología crítica a través de la cual estudiar la fase intraoperatoria de la atención con el objetivo de aumentar los procesos de toma de decisiones de los cirujanos, respaldar una cirugía más segura y ampliar el acceso. a la atención quirúrgica. Si bien se ha realizado mucho trabajo sobre posibles casos de uso, actualmente no existen herramientas CV ampliamente utilizadas para aplicaciones diagnósticas o terapéuticas en cirugía. Usando la colecistectomía laparoscópica como ejemplo, revisamos las técnicas CV actuales que se han aplicado a la cirugía mínimamente invasiva y sus aplicaciones clínicas. Finalmente, discutimos los desafíos y obstáculos que quedan por superar para una implementación y adopción más amplias de CV en cirugía.

Con más de 330 millones de procedimientos realizados anualmente, la cirugía representa un segmento crítico de los sistemas de salud en todo el mundo1. La cirugía, sin embargo, no es fácilmente accesible para todos. La Comisión Lancet sobre Cirugía Global estimó que se necesitan 143 millones de procedimientos quirúrgicos adicionales cada año para "salvar vidas y prevenir discapacidades"2. Las mejoras en la atención perioperatoria y la introducción de enfoques mínimamente invasivos han hecho que la cirugía sea más eficaz pero también más compleja y costosa, y la cirugía representa alrededor de un tercio de los costos de atención médica en los EE. UU.3. Además, una gran proporción de los errores médicos prevenibles ocurren en los quirófanos (OR)4. Estas observaciones sugieren la necesidad de desarrollar soluciones para mejorar la seguridad y la eficiencia quirúrgica.

El análisis de videos de procedimientos quirúrgicos y actividades de quirófano podría ofrecer estrategias para mejorar esta fase crítica de la atención quirúrgica. Esto es especialmente cierto para los procedimientos realizados con un enfoque mínimamente invasivo, que se está adoptando cada vez más a nivel mundial5,6,7 y depende en gran medida de la visualización proporcionada por las cámaras de fibra óptica. De hecho, en la cirugía mínimamente invasiva, la pérdida parcial de la retroalimentación háptica se compensa con videos de alta definición ampliados adquiridos por cámaras endoscópicas8. Los videos endoscópicos que guían los procedimientos quirúrgicos representan una fuente directa y fácilmente disponible de datos digitales sobre la fase intraoperatoria de la atención quirúrgica.

En los últimos años, el análisis de videos endoscópicos de procedimientos quirúrgicos mínimamente invasivos ha permitido estudiar el impacto de las actividades de quirófano en los resultados de los pacientes9 y evaluar iniciativas de mejora de la calidad10. Además, la evaluación basada en video (VBA) se está investigando cada vez más para la evaluación del desempeño operativo, la retroalimentación formativa y la acreditación quirúrgica. Sin embargo, VBA ha permanecido principalmente confinado al dominio de la investigación dada la carga de revisar manualmente y evaluar constantemente los videos quirúrgicos11,12. Ampliando los éxitos iniciales en la cirugía mínimamente invasiva, el uso del video también ha ido en aumento en la cirugía abierta13.

La visión por computadora (CV), una disciplina de las ciencias de la computación que utiliza técnicas de inteligencia artificial (IA) como el aprendizaje profundo (DL) para procesar y analizar datos visuales, podría facilitar el análisis de video endoscópico y permitir el escalado de aplicaciones en beneficio de un grupo más amplio de personas. cirujanos y pacientes14. Además, mientras que los humanos tienden a evaluar las imágenes cualitativamente, los algoritmos informáticos tienen el potencial de extraer información invisible, cuantitativa y objetiva sobre eventos intraoperatorios. Finalmente, el análisis de video endoscópico automatizado en línea podría permitirnos monitorear casos en tiempo real, predecir complicaciones e intervenir para mejorar la atención y prevenir eventos adversos.

Recientemente, académicos y grupos industriales han desarrollado varias soluciones CV basadas en DL, principalmente para cirugía mínimamente invasiva. Las aplicaciones de CV van desde el análisis del flujo de trabajo hasta la evaluación automatizada del desempeño. Si bien las soluciones digitales análogas se están traduciendo e implementando clínicamente a escala para aplicaciones de diagnóstico en endoscopia gastrointestinal15 y radiología16, CV en cirugía se está quedando atrás.

Discutimos el estado actual, el potencial y los posibles caminos hacia el valor clínico de la visión artificial en cirugía. Examinamos la colecistectomía laparoscópica, actualmente el procedimiento quirúrgico más estudiado para los métodos CV, para brindar un ejemplo específico de cómo se ha abordado la CV en la cirugía; sin embargo, muchos de estos métodos también se han aplicado a la cirugía robótica, endoscópica y abierta. Finalmente, discutimos los esfuerzos recientes para mejorar el acceso y los métodos para modelar mejor los datos quirúrgicos junto con las consideraciones éticas, legales y educativas fundamentales para brindar valor a los pacientes, los médicos y los sistemas de atención médica.

La colecistectomía es el procedimiento quirúrgico abdominal más común, con casi un millón de casos realizados solo en los EE. UU. cada año17. La seguridad y la eficacia de la cirugía mínimamente invasiva se demostraron hace más de dos décadas y, desde entonces, la laparoscopia se ha convertido en el método de referencia para la extracción de la vesícula biliar. La colecistectomía laparoscópica (LC) generalmente sigue un curso quirúrgico estandarizado, es realizada por la mayoría de los cirujanos generales y, a menudo, es uno de los primeros procedimientos introducidos durante el entrenamiento quirúrgico. Un análisis relativamente reciente que reunió datos de más de cinco mil pacientes confirmó la seguridad de la CL, informando tasas generales de morbilidad y mortalidad de 1,6–5,3 % y 0,08–0,14 %, respectivamente17. No obstante, las lesiones iatrogénicas de la vía biliar (BDI) todavía complican el 0,32-1,5% de las CL17,18, tasas superiores a la incidencia comúnmente reportada en cirugía abierta19. Las BDI dieron como resultado un aumento de tres veces en la mortalidad al año, una disminución de la calidad de vida de por vida a pesar de la reparación por expertos, y se estimó que tenían un costo anual de alrededor de mil millones de dólares solo en los EE. UU.20,21. El exceso de confianza en la realización de este procedimiento quirúrgico tan común y la variabilidad en la dificultad operatoria de la CL han dado como resultado la escasa implementación de pautas de seguridad y la consiguiente no disminución de la incidencia de LVB.

Así, la ubicuidad y la estandarización de las CL han convertido a este procedimiento en un referente atractivo para la investigación y el desarrollo CV en cirugía mínimamente invasiva22,23. Además, la naturaleza visual y la importancia de BDI han incentivado tanto a la academia como a la industria a desarrollar soluciones CV para resolver esta necesidad clínica bien definida. Finalmente, el lanzamiento público de conjuntos de datos de videos de LC anotados ha aumentado el interés y ha facilitado la investigación en el campo24.

En el nivel más grueso, una cirugía se puede describir identificando el procedimiento que se está realizando. Por ejemplo, el reconocimiento automático del tipo de procedimiento laparoscópico desde los primeros 10 minutos de procedimientos quirúrgicos ha demostrado ser muy eficaz25. Aunque tales aplicaciones pueden no parecer clínicamente relevantes de inmediato, podrían servir para varios propósitos indirectos, como reducir los esfuerzos de anotación para tareas más específicas26 o activar modelos específicos de procedimientos sin intervención humana. Una vez que se identifica el tipo de procedimiento, el consenso sugiere que los procedimientos quirúrgicos pueden describirse tanto temporal como espacialmente usando una jerarquía de descriptores o anotaciones cada vez más detalladas (Fig. 1)27. En la práctica, esta jerarquía indica inherentemente una progresión natural de tareas cada vez más complejas para anotar y modelar.

Las anotaciones temporales (a) y espaciales (b) en diferentes resoluciones se utilizan para modelar tareas con detalles cada vez más finos.

En el nivel temporal más aproximado, un video quirúrgico completo se puede clasificar en fases, etapas amplias de procedimientos quirúrgicos, que se pueden dividir en pasos más específicos que se realizan para lograr objetivos quirúrgicos significativos, como exponer estructuras anatómicas específicas. En 2016, EndoNet abordó por primera vez la tarea del reconocimiento de la fase quirúrgica utilizando una red neuronal convolucional (CNN) para extraer automáticamente características visuales, incluida información sobre la apariencia de los instrumentos quirúrgicos, de cuadros de video LC24. Se podría usar un análisis temporal más detallado para reconocer actividades específicas en videos quirúrgicos. Los trabajos iniciales sobre el tema han formalizado las acciones quirúrgicas como tripletes que comprenden la herramienta que actúa como efector final, el verbo que describe la actividad en juego y la anatomía a la que se dirige (p. ej., "agarrar, retraer, vesícula biliar")28.

En el extremo temporal más breve, se pueden describir los contenidos de un solo marco, como los instrumentos o las características anatómicas. Cuando corresponda, estos contenidos se pueden localizar más espacialmente, ya sea vagamente con marcas como cuadros delimitadores dibujados alrededor de estructuras de interés o precisamente con máscaras de segmentación que delinean objetos con precisión a nivel de píxeles. Para las anotaciones espaciales, el grado de detalle se define tanto por el tipo de anotación (p. ej., cuadro delimitador frente a máscaras de segmentación) como por el objetivo que se anota (p. ej., herramientas o partes de herramientas). Además, también se pueden describir las relaciones entre diferentes objetos localizados, por ejemplo, para describir la interacción o posición relativa entre instrumentos y estructuras anatómicas.

Invariablemente, el factor limitante para la mayoría de las aplicaciones clínicas es la disponibilidad de conjuntos de datos bien anotados. Las etiquetas más gruesas, como clasificar o describir cualitativamente el contenido de una secuencia de video en lugar de segmentar cada cuadro, son menos engorrosas de anotar, pero puede parecer que sirven para aplicaciones clínicas menos directamente relevantes. Sin embargo, las etiquetas de granularidad gruesa podrían usarse para: (1) selección y navegación de datos para agilizar el uso de video para VBA; (2) educación explicando el contenido de un video a los participantes; y (3) documentación y navegación a puntos de datos específicos para luego anotar más detalles.

El trabajo fundamental sobre CV para el análisis temporal y espacial de videos endoscópicos que permite el flujo de trabajo quirúrgico automatizado y la comprensión de la escena se está traduciendo a escenarios clínicamente aplicables. LC sigue siendo el procedimiento de elección para demostrar muchos de estos escenarios dada su ubicuidad y fenómenos clínicos bien definidos; por lo tanto, discutimos las aplicaciones quirúrgicas habilitadas para CV para el análisis de video postoperatorio y la posible asistencia intraoperatoria en tiempo real en LC. Sin embargo, es importante reconocer que tales aplicaciones también se están investigando para otros procedimientos mínimamente invasivos, endoscopia gastrointestinal y cirugía abierta23,29.

Después de la operación, los modelos para el reconocimiento de procedimientos y fases quirúrgicas podrían usarse para generar automáticamente bases de datos estructuradas y segmentadas para ayudar con las iniciativas de mejora de la calidad. Si bien tales bases de datos representarían un recurso invaluable para la documentación quirúrgica, la investigación y la educación per se, la carga asociada con el análisis manual de grandes cantidades de videos presenta un cuello de botella considerable para su adopción. El análisis de video automatizado podría usarse para digerir estas grandes colecciones de videos quirúrgicos, recuperar secuencias de video significativas y extraer información significativa. Por ejemplo, los videos quirúrgicos completos se pueden analizar con modelos de detección de fase y herramienta para identificar eventos intraoperatorios y producir videos cortos de manera efectiva que documenten selectivamente la división del conducto cístico y la arteria cística, la fase más crítica de una CL30,31. Si bien este enfoque bastante simple podría aplicarse a una variedad de procedimientos, la adaptación a otros casos de uso aún requeriría un desarrollo considerable. Muy recientemente, los métodos de vanguardia han permitido superar tales barreras al permitir la recuperación de video a video, la tarea de usar un video para buscar videos con eventos similares32,33. Además, los modelos para el reconocimiento de fase también se pueden usar directamente para generar automáticamente informes quirúrgicos estandarizados de LC. Al analizar tales informes basados ​​en predicciones de fase, Berlet et al. encontró que grupos de cuadros de video reconocidos incorrectamente, es decir, fallas del modelo, podrían indicar complicaciones como sangrado o problemas con la recuperación de la vesícula biliar34. Dichos eventos podrían vincularse con el registro de salud electrónico para obtener información sobre los resultados del paciente después de la cirugía.

Los modelos de CV se pueden entrenar para extraer información más matizada de videos, como sustitutos de la dificultad operativa de LC. Dado que la dificultad operatoria de la CL se correlaciona con la inflamación de la vesícula biliar, Loukas et al. entrenó a una CNN para clasificar el grado de vascularización de la pared de la vesícula biliar con un rendimiento comparable al de cirujanos expertos35. De manera similar, Ward et al. entrenó a una CNN para clasificar la inflamación de la vesícula biliar de acuerdo con la escala de calificación de Parkland, un sistema de 5 niveles basado en cambios anatómicos. Esta clasificación luego contribuyó a las predicciones de eventos como la fuga de bilis de la vesícula biliar durante la cirugía y proporcionó información sobre cómo los aumentos en la inflamación se correlacionan con los tiempos quirúrgicos prolongados36.

Los modelos CV para la detección de herramientas se han utilizado para evaluar las habilidades técnicas de los cirujanos. En este sentido, Jin et al. mostró que la información inferida automáticamente sobre los patrones de uso de herramientas, el rango de movimiento y la economía se correlacionaba con el desempeño evaluado por los cirujanos utilizando métricas de evaluación validadas37. Más recientemente, Lavanchy et al. han propuesto transformar la información de ubicación de la herramienta extraída automáticamente en características de movimiento de serie temporal para usar como entrada de un modelo de regresión para predecir las habilidades quirúrgicas y distinguir el rendimiento técnico bueno del pobre38. Sin embargo, estos intentos de evaluar automáticamente las habilidades técnicas no se han basado en medidas de habilidad existentes y validadas; por lo tanto, se requiere más investigación para determinar si las evaluaciones automatizadas de habilidades complementarán o reemplazarán los métodos de evaluación tradicionales39.

Prevemos la adopción de IA para ayudar durante los procedimientos mínimamente invasivos (Fig. 2). En este entorno, las predicciones en tiempo real de los modelos CV podrían usarse para guiar a los alumnos, mejorar el rendimiento del cirujano y mejorar la comunicación en el quirófano. Al iniciar una CL, los modelos CV podrían evaluar automáticamente la apariencia de la vesícula biliar35,36, ajustar las estimaciones preoperatorias de la dificultad quirúrgica40 y sugerir si ese caso es más apropiado para un cirujano en formación o experimentado. Una vez que se expone la vesícula biliar, las pautas quirúrgicas sugieren el uso de puntos de referencia anatómicos para ayudar a guiar las zonas seguras para la incisión. Por ejemplo, Tokuyasu et al. desarrolló un modelo para detectar automáticamente dichos puntos de referencia clave con cuadros delimitadores41.

Los modelos CV resumidos podrían usarse para evaluar la dificultad de un caso y si es adecuado para un residente de cirugía (a), para advertir a los cirujanos contra la incisión debajo del sitio apropiado (b), para guiar la disección segura (c), para evaluar automáticamente medidas de seguridad (d), para evitar aplicaciones incorrectas de los clips (e) y para mejorar la concienciación y preparación del personal de quirófano.

De manera similar, los modelos de aprendizaje profundo podrían usarse para proporcionar una superposición codificada por colores en el video quirúrgico que, en última instancia, podría servir como asistente de navegación para los cirujanos. Madani et al. han utilizado anotaciones de cirujanos expertos para capacitar a GoNoGoNet para identificar áreas de disección seguras e inseguras42. El criterio de valoración de la disección segura del triángulo hepatoquístico es lograr la visión crítica de la seguridad (CVS), un punto de control recomendado universalmente para identificar de manera concluyente la anatomía hepatoquística y prevenir la ilusión de percepción visual que causa el 97 % de las principales BDI43,44. Al respecto, Mascagni et al. han desarrollado un modelo de CV de dos etapas para primero segmentar las herramientas quirúrgicas y la anatomía hepatoquística de grano fino para luego predecir si cada uno de los tres criterios de CVS se ha logrado45.

Si bien la confirmación automática del CVS puede proporcionar al cirujano una garantía adicional de la anatomía, otras herramientas de CV pueden garantizar que los clips estén bien colocados y que no se recorten otras estructuras sin darse cuenta. Para proporcionar dicha asistencia, Aspart et al. recientemente propuso ClipAssistNet, una red neuronal entrenada para detectar las puntas de un aplicador de clips durante LC46. Si los cirujanos experimentados pueden encontrar dicha asistencia innecesaria e incluso trivial, los cirujanos en formación y los primeros en su carrera pueden beneficiarse de la tranquilidad que brindan los algoritmos de soporte de decisiones en tiempo real como GoNoGoNet, DeepCVS y ClipAssistNet. Dichos algoritmos podrían servir como versiones automatizadas de entrenadores quirúrgicos que pueden facilitar y aumentar la toma de decisiones en el quirófano39.

A un nivel más amplio, el análisis del flujo de trabajo en tiempo real podría usarse para mejorar la comunicación, el conocimiento de la situación y la preparación de todo el equipo quirúrgico. El análisis de videos quirúrgicos, modelos de detección de fase23 y algoritmos para estimar los tiempos quirúrgicos restantes47 puede ayudar a rastrear el progreso de la operación para ayudar al personal de quirófano y al anestesista a planificar el caso actual y el siguiente. Además, el análisis del flujo de trabajo podría ayudar a detectar la desviación de un curso intraoperatorio esperado y desencadenar una solicitud automática de respaldo o una segunda opinión. Finalmente, se podría analizar un resumen postoperatorio visual de los eventos intraoperatorios o “huella digital quirúrgica” con el perfil preoperatorio del paciente para evaluar el riesgo de morbimortalidad postoperatoria48.

A pesar de la plétora de métodos para el análisis automatizado de videos de LC presentados en los últimos años, se han propuesto pocos sistemas CV basados ​​en IA para analizar otros procedimientos quirúrgicos, y la mayoría se enfoca en procedimientos mínimamente invasivos. Esto dificulta el impacto clínico, hasta el punto de que actualmente ninguna aplicación CV es muy utilizada en cirugía.

Las razones de esta falta de generalización y traducción clínica son múltiples, pero en gran medida se centran en la disponibilidad y calidad de los datos y el rendimiento de los enfoques de modelado existentes, dos elementos clave para la CV en cirugía que están íntimamente entrelazados.

Históricamente, los procedimientos quirúrgicos se demostraban frente a los alumnos y compañeros en quirófanos con asientos estilo estadio y ventanas para la luz natural. Ahora, sin embargo, los quirófanos (OR) son uno de los componentes más aislados de los sistemas de atención médica. La información sobre los eventos de quirófano generalmente solo se informa en las notas posoperatorias dictadas por el cirujano o se deduce indirectamente de los resultados quirúrgicos posoperatorios. Como tal, durante mucho tiempo ha sido difícil recopilar información procesable sobre los eventos adversos (EA) intraoperatorios, que ocurren en hasta el 2 % de todos los casos quirúrgicos49. En consecuencia, las necesidades clínicas se identificaron principalmente anecdóticamente al entrevistar a cirujanos y líderes de opinión clave, una práctica subóptima propensa a sesgos.

Hoy en día, una mayor solicitud de documentación quirúrgica, junto con la facilidad de grabar videos endoscópicos de procedimientos quirúrgicos mínimamente invasivos, han mejorado en gran medida nuestra capacidad para observar eventos intraoperatorios y trabajar para diseñar soluciones que mejoren la seguridad y la eficiencia quirúrgica. Sin embargo, todavía no hay mucha aceptación en torno al registro y análisis de datos quirúrgicos. En una encuesta de miembros de una gran sociedad quirúrgica, Mazer et al. descubrió que los cirujanos grabaron menos del 40 % de sus casos, aunque deseaban poder capturar hasta el 80 % de los videos. Los cirujanos sintieron que la falta de equipo, las políticas institucionales y las preocupaciones médico-legales eran obstáculos para registrar los casos50.

Las preocupaciones de los cirujanos y los sistemas de salud que temen que los datos intraoperatorios puedan usarse en su contra pueden ser infundadas. Una revisión reciente de los dispositivos de grabación de caja negra en el quirófano ha sugerido que los datos de video apoyan predominantemente a los cirujanos en casos de negligencia51. Por lo tanto, las instituciones han comenzado en gran medida a implementar un enfoque individualizado para la grabación de video que se adapta a sus propias necesidades. Algunos continúan prohibiendo el almacenamiento de video, otros lo permiten para fines seleccionados pero con parámetros específicamente definidos (p. ej., destrucción programada de datos cada 30 días), mientras que otros aún fomentan la grabación y el almacenamiento de video solo con fines de mejora de la calidad, educación e investigación. . Por lo tanto, las instituciones deben participar en una revisión de las políticas existentes e involucrar a las partes interesadas, como los funcionarios de gestión de riesgos, las aseguradoras de mala práctica, los cirujanos y los pacientes, para determinar la mejor estrategia local para la grabación de video. Reglas institucionales claras guiarían a los cirujanos que deseen registrar sus casos por varias razones, incluido, entre otros, el uso con fines de ciencia de datos quirúrgicos.

Las políticas y los incentivos pueden ayudar a cambiar aún más la cultura de la recopilación de datos quirúrgicos para favorecer una mayor recopilación y uso de datos operativos entre los médicos que, de otro modo, no considerarían el valor de los análisis intraoperatorios de video y visión por computadora. Las instituciones que entienden el valor de los datos de video pueden desempeñar un papel en incentivar a los médicos. Como ejemplo, AdventHealth, un gran sistema de salud académico en los Estados Unidos (EE. UU.), se asoció con una organización de seguridad del paciente (PSO) para recopilar y analizar datos enviados voluntariamente y brindar retroalimentación a los médicos, para mejorar sus iniciativas de mejora de la calidad en torno a la retroalimentación operativa52 . En los EE. UU., las PSO se establecieron mediante la Ley de mejora de la calidad y la seguridad del paciente de 2005 y protegen los productos de trabajo de seguridad del paciente de los datos presentados voluntariamente con fines de mejora de la calidad de los procedimientos civiles, penales, administrativos y disciplinarios, excepto en circunstancias limitadas y específicas. Las PSO son organizaciones independientes de un sistema de salud y certificadas por la Agencia de Investigación y Calidad de la Atención Médica de EE. UU. (AHRQ).

Además, AdventHealth ofreció los créditos de educación médica continua (CME) necesarios para la renovación de licencias y la certificación continua de la junta como un incentivo individual adicional para que los cirujanos graben y envíen videos y revisen los videos de otros para mejorar la calidad y fines educativos, como la revisión por pares y la retroalimentación. Al combinar la garantía legal de privacidad con incentivos individuales en forma de CME, este sistema de salud ha fomentado la presentación voluntaria de datos de video de la mayoría de sus cirujanos. Tales protecciones e incentivos deben ser considerados por otros sistemas de salud para alentar la participación voluntaria no solo en los programas de mejora de la calidad, sino también en los esfuerzos para desarrollar algoritmos CV que puedan facilitar tales iniciativas de mejora de la calidad. En última instancia, la mejora de los incentivos y las directrices claramente reglamentarias podrían ampliar la lista de conjuntos de datos disponibles públicamente sobre los que podrían desarrollarse y probarse algoritmos CV53.

No es solo la cantidad de datos disponibles lo que limita el valor clínico de las aplicaciones de visión artificial, sino también la calidad de esos datos. Si bien las mediciones estandarizadas con variabilidad predecible se pueden utilizar en datos tabulares, como valores de laboratorio para hemoglobina o creatinina, definir fenómenos clínicos en videos quirúrgicos (es decir, anotación) puede ser bastante difícil. La cirugía abierta presenta desafíos únicos que ocurren con la oclusión de datos de video de los propios movimientos del cirujano, lo que requiere múltiples ángulos de cámara, sensores adicionales o enfoques algorítmicos para superar la oclusión y considerar la complejidad adicional de las interacciones mano-herramienta54,55,56.

Se necesitan protocolos de anotación claros con una amplia capacitación de anotadores para garantizar que las anotaciones temporales y espaciales en los videos quirúrgicos sean claras, confiables y reproducibles. Los objetivos de un proyecto dado pueden ayudar a definir las necesidades de anotación y deben establecerse claramente a priori para garantizar que se establezcan y midan las verdades básicas apropiadas. Además, los protocolos de anotación deben compartirse públicamente para favorecer la reproducibilidad y la confianza al permitir que otros colaboren y al mismo tiempo permitir una evaluación independiente de la realidad básica utilizada para entrenar y probar modelos de CV57. Ward et al. proporcione más detalles sobre las dificultades de anotar videos quirúrgicos y sugiera varios pasos clave que pueden mitigar el desempeño deficiente o inaplicable del modelo relacionado con la anotación deficiente o inapropiada58.

A medida que se identifican más y más aplicaciones clínicas, se están introduciendo técnicas progresivamente eficaces para modelar estas aplicaciones y aportar valor a los pacientes. Más allá del modelado específico de la aplicación, también se están desarrollando métodos para ayudar a eludir o mitigar las limitaciones técnicas, reglamentarias, éticas y clínicas endémicas de la cirugía.

Para desarrollar soluciones clínicas efectivas, los modelos de IA a menudo se entrenan para replicar el desempeño de expertos a partir de grandes cantidades de datos bien anotados (es decir, aprendizaje completamente supervisado). Si bien conduce a resultados sin precedentes en el análisis de imágenes médicas59, este paradigma de aprendizaje depende en gran medida de la disponibilidad de grandes conjuntos de datos anotados. Por lo tanto, su sostenibilidad está severamente limitada por problemas como las estrictas restricciones regulatorias sobre el intercambio de datos y el costo de oportunidad para que los médicos anoten los datos, lo que hace que la generación de grandes conjuntos de datos esté lejos de ser trivial60. Estos problemas se ven agravados por la necesidad de representar bien y tener en cuenta las variaciones entre los pacientes (anatomía, datos demográficos, etc.), las interacciones del cirujano (flujo de trabajo, habilidades, etc.) y el hardware del quirófano (instrumentos, sistemas de adquisición de datos, etc.). ).

Se han explorado varias soluciones para aumentar la cantidad de datos disponibles, como el uso de conjuntos de datos generados sintéticamente61 o el aumento artificial de conjuntos de datos anotados disponibles62. Aún así, modelar suficientemente el rango de posibles interacciones sigue siendo un problema abierto. Recientemente, los enfoques para la capacitación descentralizada (por ejemplo, el aprendizaje federado) han comenzado a ganar fuerza63, lo que permite aprender de los datos en ubicaciones físicas remotas, mitigar las preocupaciones sobre la privacidad y aumentar la esperanza de una mayor accesibilidad a los datos.

Sin embargo, incluso con grandes cantidades de datos disponibles, las anotaciones de calidad siguen siendo escasas y costosas de producir. Para reducir la dependencia de las anotaciones, se han propuesto diferentes soluciones, aprovechando la información intrínseca presente en los datos sin etiquetar o reutilizando el conocimiento adquirido en diferentes tareas y dominios. Los enfoques autosupervisados ​​tienen como objetivo aprender información útil a partir de grandes cantidades de datos no etiquetados mediante la formulación de tareas previas al texto que no requieren anotaciones externas64. Los enfoques semisupervisados ​​también aprovechan grandes cantidades de datos sin etiquetar, pero los combinan con pequeñas cantidades de datos anotados. Esta estrategia a menudo implica el etiquetado artificial de datos no etiquetados, guiado por algunos datos etiquetados disponibles65,66.

Los métodos poco supervisados ​​tienen como objetivo refinar las anotaciones fácilmente disponibles pero ruidosas, como las etiquetas de fuentes colectivas67, o reutilizar las anotaciones existentes recopiladas para diferentes tareas (por ejemplo, aprender la localización de herramientas quirúrgicas utilizando anotaciones no espaciales como la presencia de herramientas binarias68). Cuando dichas anotaciones están disponibles al mismo tiempo que las anotaciones de la tarea objetivo, se puede realizar un entrenamiento multitarea (p. ej., usar señales de presencia de herramienta para ayudar a informar qué fase quirúrgica se está realizando y viceversa)24. Alternativamente, los enfoques de transferencia de aprendizaje ayudan a reutilizar la información aprendida de diferentes tareas y/o dominios, para los cuales los conjuntos de datos anotados están más fácilmente disponibles, y aplicarlos al dominio y la tarea de interés (Tabla 1). Un ejemplo común es el empleo del aprendizaje por transferencia a partir de grandes conjuntos de datos no quirúrgicos bien etiquetados, como ImageNet69. La adaptación del dominio es otro paradigma popular de transferencia de aprendizaje cuando se trata de datos provenientes de dominios similares al objetivo, como conjuntos de datos quirúrgicos sintéticos61.

A pesar de que se están desarrollando modelos cada vez más efectivos para diversas aplicaciones clínicas, también se requieren métodos técnicos para equipar al personal quirúrgico con los medios para explicar las predicciones de IA, interpretar las razones detrás de ellas, estimar la certeza predictiva y, en consecuencia, generar confianza en los propios modelos. Estas consideraciones recién comienzan a abordarse en las aplicaciones de atención médica70 y son particularmente notorias en el caso de los algoritmos de "caja negra", como los métodos basados ​​en el aprendizaje profundo, donde las relaciones entre la entrada y la salida no siempre son explícitas o bien entendidas. Aquí, establecer, formalizar y comunicar las relaciones causales entre las características de la entrada y la salida del modelo podría ayudar a mitigar las fallas peligrosas del modelo y potencialmente informar el diseño del modelo71. También es importante formalizar los procesos para identificar, registrar y responder a posibles fuentes de error antes y después de la implementación del modelo. Con este fin, Liu et al. presentar un marco para auditar aplicaciones médicas de inteligencia artificial72.

El trabajo futuro podría mirar más allá de estos problemas a los métodos que pueden identificar cuando se trata de datos desconocidos (fuera de distribución). Además de permitir que los médicos tomen decisiones informadas basadas en la confiabilidad del sistema de IA en entornos específicos, esto también podría ayudar a los investigadores a reconocer y abordar los sesgos de selección de datos y otros factores de confusión presentes en los conjuntos de datos utilizados para entrenar estos modelos.

Cada aplicación clínica exige que se satisfagan condiciones específicas para que se entregue de manera oportuna y adecuada de acuerdo con los flujos de trabajo técnicos y clínicos existentes. A medida que se desarrollan varios métodos para servir y apoyar a varias partes interesadas durante las diferentes etapas de la atención perioperatoria, también será necesario considerar cuidadosamente las optimizaciones de hardware y software. La latencia aceptable, los errores y las interfaces ergonómicas son factores clave en esta discusión. Por ejemplo, ciertas optimizaciones, como ejecutar estos modelos con precisiones reducidas, pueden ayudar a reducir drásticamente la infraestructura computacional necesaria para implementar estos modelos, pero pueden degradar el rendimiento. Para aplicaciones menos sensibles al tiempo, se ha explorado la computación en la nube para la asistencia y navegación de IA, pero está limitada por la conectividad de la red73.

Los enfoques que hemos revisado demuestran que los métodos modernos tienen la capacidad técnica de traducir los avances de la visión artificial en la atención quirúrgica. Sin embargo, quedan varios obstáculos y desafíos para desbloquear el potencial de la visión por computadora en la cirugía (Fig. 3). Si bien la traducción del quirófano, la validación clínica y la implementación a escala de las soluciones CV son sin duda fundamentales para brindar el valor quirúrgico prometido, estos pasos involucran a múltiples partes interesadas, desde fabricantes de dispositivos hasta reguladores, y siguen sin explorarse en gran medida en la actualidad. Aquí nos enfocamos en consideraciones éticas, culturales y educativas importantes para los cirujanos y sus pacientes.

Los obstáculos de comportamiento y técnicos/operativos pueden limitar el desarrollo y la implementación de modelos CV en cirugía. Una combinación de cambios estatutarios, de comportamiento y operativos en los entornos reglamentario, clínico y técnico podría resultar en mejoras en la aplicación de CV para cirugía. Inteligencia artificial AI, organización de seguridad del paciente PSO, educación médica continua CME o quirófano.

Se deben abordar varias cuestiones éticas, incluidas la seguridad y la transparencia de los datos, la privacidad y la equidad y el sesgo74. Se están produciendo debates en curso tanto a nivel nacional como internacional para determinar la mejor manera de proteger a los pacientes sin prohibir las innovaciones en el análisis de datos que podrían generar una atención quirúrgica más segura. Las consideraciones para la seguridad, transparencia y privacidad de los datos incluyen conceptos de consentimiento informado por parte de los pacientes, seguridad de los datos y propiedad y acceso a los datos, incluso si los pacientes tienen derecho a controlar y supervisar cómo se utilizan sus datos personales.

En un análisis cualitativo de 49 perspectivas de pacientes de grabación de video a través de un sistema hipotético de "caja negra" que podría capturar todos los datos quirúrgicos en el quirófano, el 88 % de los pacientes sintieron que la propiedad de los datos de video les pertenecía a ellos en lugar del hospital en el que se encontraban. recibió su atención o al cirujano que realizó sus operaciones75. Las regulaciones sobre la propiedad, la privacidad y el uso de datos identificables y seudonimizados varían según el país (e incluso según las normas estatales, locales e institucionales), por lo que los esfuerzos de investigación se han limitado en gran medida a instituciones individuales o consorcios locales donde puede ser más fácil definir quién. posee datos bajo una determinada infraestructura legal y cómo se pueden utilizar. A medida que continúan los esfuerzos para comprender mejor las necesidades del campo en el desarrollo de tecnología que podría salvar vidas para la atención quirúrgica, será de vital importancia garantizar que los pacientes sean incluidos y priorizados en las discusiones que conciernen al uso de los datos generados a través de sus encuentros de salud.

Los pacientes podrían ser un fuerte defensor de la investigación de la visión por computadora en cirugía, ya que muchos informan que perciben que un beneficio de la grabación de video es permitir un registro objetivo del caso para ayudar en la atención futura y servir como protección médico-legal tanto para el paciente como para el paciente. cirujano. Es importante destacar que los pacientes destacaron su deseo de que dichos datos se utilicen para la mejora continua de la calidad75. El uso de modelos de visión por computadora como los que hemos descrito anteriormente puede facilitar cada uno de estos beneficios hoy en día, ya que los algoritmos conscientes del contexto pueden indexar automáticamente los casos para una revisión rápida y el uso post hoc de algoritmos de guía puede proporcionar retroalimentación visual a los cirujanos. De hecho, algunas instituciones están utilizando estas tecnologías para facilitar las discusiones en las conferencias semanales de morbilidad y mortalidad con el fin de mejorar la calidad.

En publicaciones recientes76,77 también se han destacado consideraciones adicionales sobre la equidad y el sesgo de los conjuntos de datos que afectan el rendimiento del modelo y la falta de transparencia algorítmica. Se debe reconocer y considerar el sesgo en los conjuntos de datos, especialmente dado que muchos conjuntos de datos actuales y futuros se obtendrán de plataformas laparoscópicas y robóticas que pueden no ser tan accesibles para los países de bajos y medianos ingresos. También es importante que los investigadores reconozcan que se puede introducir un sesgo a nivel de cada operación, ya que los cirujanos llevan consigo la influencia de su formación y experiencia quirúrgica previa en la toma de decisiones quirúrgicas. La fusión de tales influencias indudablemente introducirá sesgos en los conjuntos de datos que podrían afectar el rendimiento del modelo y, por lo tanto, la generalización de las herramientas CV en cirugía.

A medida que se reconoce cada vez más la importancia del sesgo en los conjuntos de datos y la necesidad de datos representativos y generalizables, han aumentado los esfuerzos en torno a la expansión de la naturaleza colaborativa de la investigación de IA para la cirugía. Por ejemplo, Global Surgical Artificial Intelligence Collaborative (GSAC), una organización sin fines de lucro dedicada a promover la democratización de la atención quirúrgica a través de la intersección de educación, innovación y tecnología, ha estado facilitando colaboraciones de investigación entre instituciones en los EE. UU., Canadá y Europa. proporcionando herramientas para la anotación, el intercambio de datos y el desarrollo de modelos que cumplan con los estándares regulatorios de cada uno de los países de origen de las instituciones participantes. Esfuerzos enfocados como GSAC pueden reducir la barrera de entrada para instituciones e individuos sin un acceso significativo a datos o recursos computacionales al facilitar la distribución de costos, proporcionar infraestructura y ampliar el acceso a la experiencia técnica y quirúrgica para el trabajo colaborativo.

Finalmente, la educación en ciencia de datos quirúrgicos es de suma importancia, tanto para garantizar que los médicos actuales puedan comprender cómo la visión por computadora y otras herramientas de IA impactan en la toma de decisiones y en los pacientes, como para permitir que las generaciones futuras contribuyan con sus propios conocimientos en el desarrollo de nuevos y más sofisticados. herramientas. El Royal College of Physicians and Surgeons of Canada identificó recientemente la alfabetización digital en salud como una nueva competencia potencial para los médicos canadienses en la práctica especializada, destacando la importancia de nuevas carreras que combinen el conocimiento médico con la educación de posgrado en IA, así como equipos clínicos multidisciplinarios que incorporen científicos de datos e investigadores de IA78. Se llegó a una conclusión similar en Topol Review del Reino Unido sobre la preparación de la fuerza laboral de atención médica para un futuro digital en el Servicio Nacional de Salud (NHS), y el NHS posteriormente estableció Topol Digital Fellowships para enseñar técnicas de transformación digital79. Ahora se están estableciendo becas interdisciplinarias institucionales para promover una mayor alfabetización de los médicos en temas de IA y una mayor comprensión de los problemas clínicos y el flujo de trabajo por parte de ingenieros y científicos de datos. Además, instituciones como IHU Strasbourg ofrecen cursos breves e intensivos en ciencia de datos quirúrgicos tanto para médicos como para ingenieros/científicos de datos para promover la educación y la colaboración interdisciplinaria.

La visión artificial ofrece un medio sin precedentes para estudiar y mejorar la fase intraoperatoria de la cirugía a escala. A medida que las comunidades clínica y de ciencia de datos han comenzado a converger en el avance de la investigación y la investigación científica sobre la mejor manera de utilizar CV en cirugía, se han demostrado varias aplicaciones de prueba de concepto de valor clínico potencial en cirugía mínimamente invasiva. Los esfuerzos clave para generalizar dichas aplicaciones se centran en optimizar el acceso a los datos quirúrgicos y mejores métodos de modelado, siempre considerando los aspectos culturales y éticos intrínsecos a la atención del paciente. A medida que madura la CV en cirugía, será necesaria una participación social más amplia para garantizar que las promesas de CV en cirugía se traduzcan de manera segura y eficaz para ayudar en el cuidado de los pacientes quirúrgicos.

El intercambio de datos no se aplica a este artículo ya que no se generaron ni analizaron conjuntos de datos durante el estudio actual.

Weiser, TG et al. Estimación del volumen global de cirugía en 2012: una evaluación que respalda mejores resultados de salud. Lanceta 385, S11 (2015).

Artículo PubMed Google Académico

Meara, JG et al. Cirugía Global 2030: Evidencia y soluciones para lograr salud, bienestar y desarrollo económico. Cirugía 158, 3–6 (2015).

Artículo PubMed Google Académico

Childers, CP & Maggard-Gibbons, M. Comprender los costos de la atención en el quirófano. Cirugía JAMA. 153, e176233 (2018).

Artículo PubMed PubMed Central Google Académico

Zegers, M. et al. La incidencia, las causas fundamentales y los resultados de los eventos adversos en las unidades quirúrgicas: implicaciones para las posibles estrategias de prevención. Seguridad del paciente Cirugía 5, 13 (2011).

Artículo PubMed PubMed Central Google Académico

Lewandrowski, K.-U. et al. Variaciones regionales en la aceptación y utilización de técnicas de cirugía espinal mínimamente invasivas entre los cirujanos de columna: resultados de una encuesta global. J. Spine Surg. 6, S260–S274 (2020).

Artículo PubMed PubMed Central Google Académico

Bardakcioglu, O., Khan, A., Aldridge, C. & Chen, J. Crecimiento de la colectomía laparoscópica en los Estados Unidos: análisis de factores regionales y socioeconómicos a lo largo del tiempo. Ana. Cirugía 258, 270–274 (2013).

Artículo PubMed Google Académico

Richards, MK et al. Una revisión nacional de la frecuencia de la cirugía mínimamente invasiva entre los residentes de cirugía general: evaluación de los registros de casos de ACGME durante 2 décadas de formación de residentes de cirugía general. Cirugía JAMA. 150, 169–172 (2015).

Artículo PubMed Google Académico

Zhou, M. et al. Efecto de la retroalimentación háptica en la adquisición de habilidades en cirugía laparoscópica. Cirugía Endosc. 26, 1128–1134 (2012).

Artículo CAS PubMed Google Académico

Balvardi, S. et al. La asociación entre la evaluación basada en video del rendimiento técnico intraoperatorio y los resultados del paciente: una revisión sistemática. Cirugía Endosc. https://doi.org/10.1007/s00464-022-09296-6 (2022).

Mascagni, P. et al. Tiempo de espera intraoperatorio para promover la implementación de la visión crítica de la seguridad en la colecistectomía laparoscópica: una evaluación basada en video de 343 procedimientos. Mermelada. Col. Cirugía 233, 497–505 (2021).

Artículo PubMed Google Académico

Pugh, CM, Hashimoto, DA y Korndorffer, JR Jr. ¿El qué? ¿Cómo? ¿Y quien? De evaluación basada en video. Soy. J. Cirugía. 221, 13–18 (2021).

Artículo PubMed Google Académico

Feldman, LS y col. Programa SAGES Video-Based Assessment (VBA): una visión para el aprendizaje de por vida para los cirujanos. Cirugía Endosc. 34, 3285–3288 (2020).

Artículo PubMed Google Académico

Sharma, G. et al. Un curso de simulación de anatomía de procedimientos cadavéricos mejora la evaluación basada en videos del desempeño quirúrgico. J. Cirugía. Res. 223, 64–71 (2018).

Artículo PubMed Google Académico

Ward, TM et al. Visión artificial en cirugía. Cirugía 169, 1253–1256 (2021).

Artículo PubMed Google Académico

Hassan, C. et al. Rendimiento de la inteligencia artificial en la colonoscopia para la detección de adenomas y pólipos: una revisión sistemática y un metanálisis. Gastrointestinal. Endosc. 93, 77–85.e6 (2021).

Artículo PubMed Google Académico

van Leeuwen, KG, Schalekamp, ​​S., Rutten, MJCM, van Ginneken, B. & de Rooij, M. Inteligencia artificial en radiología: 100 productos disponibles comercialmente y su evidencia científica. EUR. Radiol. 31, 3797–3804 (2021).

Artículo PubMed PubMed Central Google Académico

Pucher, PH et al. Tendencias de resultados y medidas de seguridad después de 30 años de colecistectomía laparoscópica: una revisión sistemática y análisis de datos agrupados. Cirugía Endosc. 32, 2175–2183 (2018).

Artículo PubMed PubMed Central Google Académico

Törnqvist, B., Strömberg, C., Persson, G. y Nilsson, M. Efecto de la colangiografía intraoperatoria prevista y la detección temprana de lesión del conducto biliar en la supervivencia después de la colecistectomía: estudio de cohorte basado en la población. BMJ 345, e6457 (2012).

Artículo PubMed PubMed Central Google Académico

Un análisis prospectivo de 1518 colecistectomías laparoscópicas. N. ingl. J.Med. 324, 1073–1078 (1991).

Rogers, SO Jr. et al. Análisis de errores quirúrgicos en reclamaciones cerradas por mala praxis en 4 aseguradoras de responsabilidad civil. Cirugía 140, 25–33 (2006).

Artículo PubMed Google Académico

Berci, G. et al. Colecistectomía laparoscópica: primero, no hacer daño; segundo, cuidar los cálculos en las vías biliares. Cirugía Endosc. 27, 1051–1054 (2013).

Artículo PubMed Google Académico

Anteby, R. et al. Análisis visual de aprendizaje profundo en cirugía laparoscópica: una revisión sistemática y un metanálisis de precisión de la prueba diagnóstica. Cirugía Endosc. 35, 1521-1533 (2021).

Artículo PubMed Google Académico

Garrow, CR et al. Aprendizaje automático para el reconocimiento de la fase quirúrgica: una revisión sistemática. Ana. Cirugía 273, 684–693 (2021).

Artículo PubMed Google Académico

Twinanda, AP et al. EndoNet: Una arquitectura profunda para tareas de reconocimiento en videos laparoscópicos. Trans. IEEE. Medicina. Imágenes 36, 86–97 (2017).

Artículo PubMed Google Académico

Kannan, S., Yengera, G., Mutter, D., Marescaux, J. & Padoy, N. Future-State Predicting LSTM para el reconocimiento temprano del tipo de cirugía. Trans. IEEE. Medicina. Imágenes 39, 556–566 (2020).

Artículo PubMed Google Académico

Yengera, G., Mutter, D., Marescaux, J. & Padoy, N. Menos es más: reconocimiento de fase quirúrgica con menos anotaciones a través del entrenamiento previo autosupervisado de redes CNN-LSTM. arXiv [cs.CV] (2018).

Meireles, OR et al. Recomendaciones de consenso de SAGES sobre un marco de anotación para video quirúrgico. Cirugía Endosc. En Prensa, (2021).

Nwoye, CI et al. Rendezvous: Mecanismos de atención para el reconocimiento de tripletes de acción quirúrgica en videos endoscópicos. Medicina. Anal de imagen. 78, 102433 (2022).

Artículo PubMed Google Académico

Yeung, S. et al. Un modelo de IA espaciotemporal en tiempo real analiza la habilidad en videos quirúrgicos abiertos. Res. Plaza https://doi.org/10.21203/rs.3.rs-1129461/v1 (2021).

Mascagni, P. et al. Una plataforma de visión por computadora para ubicar automáticamente eventos críticos en videos quirúrgicos: documentación de la seguridad en la colecistectomía laparoscópica. Ana. Cirugía 274, e93–e95 (2021).

Artículo PubMed Google Académico

Mascagni, P. et al. Validación multicéntrica de EndoDigest: una plataforma de visión por computadora para la documentación en video de la visión crítica de la seguridad en la colecistectomía laparoscópica. Cirugía Endosc. https://doi.org/10.1007/s00464-022-09112-1 (2022).

Yu, T. & Padoy, N. Codifique lo invisible: hash de video predictivo para la recuperación escalable de mitad de flujo. En: Ishikawa, H., Liu, CL., Pajdla, T., Shi, J. (eds) Computer Vision – ACCV 2020. ACCV 2020. Lecture Notes in Computer Science, vol 12626. Springer, Cham. https://doi.org/10.1007/978-3-030-69541-5_26 (2021).

Yu, T. et al. Recuperación de video laparoscópico en vivo con incertidumbre comprimida. Preimpresión en: https://arxiv.org/abs/2203.04301 (2022).

Berlet, M. et al. Informe quirúrgico para la colecistectomía laparoscópica basado en la anotación de fase por una red neuronal convolucional (CNN) y el fenómeno del parpadeo de fase: una prueba de concepto. En t. J. Cómputo. Asistir. Radiol. Cirugía https://doi.org/10.1007/s11548-022-02680-6 (2022).

Loukas, C., Frountzas, M. & Schizas, D. Clasificación basada en parches de la vascularidad de la pared de la vesícula biliar a partir de imágenes laparoscópicas utilizando aprendizaje profundo. En t. J. Cómputo. Asistir. Radiol. Cirugía 16, 103–113 (2021).

Artículo PubMed Google Académico

Ward, TM, Hashimoto, DA, Ban, Y., Rosman, G. & Meireles, OR Predicción de inteligencia artificial del curso operativo de la colecistectomía a partir de la identificación automatizada de la inflamación de la vesícula biliar. Cirugía Endosc. https://doi.org/10.1007/s00464-022-09009-z (2022).

Jin, A. et al. Detección de herramientas y evaluación de habilidades operativas en videos quirúrgicos mediante redes neuronales convolucionales basadas en regiones, Conferencia de invierno de IEEE sobre aplicaciones de visión artificial (WACV), 2018, págs. 691–699. https://doi.org/10.1109/WACV.2018.00081 (2018).

Lavanchy, JL et al. Automatización de la evaluación de habilidades quirúrgicas utilizando un algoritmo de aprendizaje automático de tres etapas. ciencia Rep. 11, 5197 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Ward, TM et al. Ciencia de datos quirúrgicos e inteligencia artificial para la educación quirúrgica. J. Cirugía. oncol. 124, 221–230 (2021).

Artículo PubMed Google Académico

Vannucci, M. et al. Modelos estadísticos para predecir preoperatoriamente la dificultad operatoria en la colecistectomía laparoscópica: una revisión sistemática. Cirugía 171, 1158–1167 (2022).

Artículo PubMed Google Académico

Tokuyasu, T. et al. Desarrollo de un sistema de inteligencia artificial utilizando aprendizaje profundo para indicar puntos de referencia anatómicos durante la colecistectomía laparoscópica. Cirugía Endosc. 35, 1651-1658 (2021).

Artículo PubMed Google Académico

Madani, A. et al. Inteligencia artificial para guía intraoperatoria. Ana. Cirugía 276, 363–369 (2022).

Artículo PubMed Google Académico

Camino, LW et al. Causas y prevención de las lesiones de la vía biliar laparoscópica. Ana. Cirugía 237, 460–469 (2003).

Artículo PubMed PubMed Central Google Académico

Brunt, LM et al. Guía de práctica multisociedad de colecistectomía segura y conferencia de consenso de vanguardia sobre prevención de lesiones de las vías biliares durante la colecistectomía. Ana. Cirugía 272, 3–23 (2020).

Artículo PubMed Google Académico

Mascagni, P. et al. Inteligencia artificial para la seguridad quirúrgica. Ana. Cirugía 275, 955–961 (2022).

Artículo PubMed Google Académico

Aspart, F. et al. ClipAssistNet: aportando información de seguridad en tiempo real a los quirófanos. En t. J. Cómputo. Asistir. Radiol. Cirugía 17, 5–13 (2022).

Artículo PubMed Google Académico

Twinanda, AP, Yengera, G., Mutter, D., Marescaux, J. & Padoy, N. RSDNet: aprender a predecir la duración restante de la cirugía a partir de videos laparoscópicos sin anotaciones manuales. Trans. IEEE. Medicina. Imágenes 38, 1069–1078 (2019).

Artículo PubMed Google Académico

Ward, TM et al. Identificación automatizada de la fase operatoria en la miotomía endoscópica peroral. Cirugía Endosc. 35, 4008–4015 (2021).

Artículo PubMed Google Académico

Mavros, MN y col. Abrir la caja de Pandora: comprender la naturaleza, los patrones y los resultados a los 30 días de los eventos adversos intraoperatorios. Soy. J. Cirugía. 208, 626–631 (2014).

Artículo PubMed Google Académico

Mazer, L., Varban, O., Montgomery, JR, Awad, MM y Schulman, A. El video es mejor: ¿por qué no lo usamos? Un estudio de métodos mixtos de las barreras para la grabación de video procesal de rutina y la revisión de casos. Cirugía Endosc. 36, 1090–1097 (2022).

Artículo PubMed Google Académico

van Dalen, ASHM, Legemaate, J., Schlack, WS, Legemate, DA & Schijven, MP Perspectivas legales sobre dispositivos de grabación de caja negra en el entorno operativo. Hermano J. Cirugía. 106, 1433–1441 (2019).

Artículo PubMed PubMed Central Google Académico

Código de Regulación Federal de los Estados Unidos. 42 CFR Capítulo I, Parte 3. https://www.ecfr.gov/current/title-42/chapter-I/subchapter-A/part-3.

Rivas-Blanco, I., Perez-Del-Pulgar, CJ, Garcia-Morales, I. & Muñoz, VF Una revisión sobre el aprendizaje profundo en cirugía mínimamente invasiva. Acceso IEEE 9, 48658–48678 (2021).

Artículo Google Académico

Shimizu, T., Hachiuma, R., Kajita, H., Takatsume, Y. & Saito, H. Localización y clasificación de herramientas quirúrgicas sensibles al movimiento manual desde una cámara egocéntrica. J. Imaging 7, 15 (2021).

Artículo PubMed PubMed Central Google Académico

Zhang, M. et al. Uso de la visión por computadora para automatizar la detección de manos y el seguimiento de los movimientos del cirujano en videos de cirugía abierta. AMIA Anual. Síntoma proc. 2020, 1373–1382 (2020).

Académico de Google de PubMed

Goldbraikh, A., D'Angelo, A.-L., Pugh, CM & Laufer, S. Evaluación completamente automática basada en video de las habilidades de sutura en cirugía abierta. En t. J. Cómputo. Asistir. Radiol. Cirugía 17, 437–448 (2022).

Artículo PubMed PubMed Central Google Académico

Mascagni, P. et al. Ciencia de datos quirúrgicos para una colecistectomía segura: un protocolo para la segmentación de la anatomía hepatoquística y la evaluación de la visión crítica de la seguridad. Preimpresión en: https://arxiv.org/abs/2106.10916 (2021).

Ward, TM et al. Desafíos en la anotación de videos quirúrgicos. Cirugía asistida por computadora (Abingdon) 26, 58–68 (2021).

Artículo Google Académico

Esteva, A. et al. Una guía para el aprendizaje profundo en el cuidado de la salud. Nat. Medicina. 25, 24–29 (2019).

Artículo CAS PubMed Google Académico

Maier-Hein, L. et al. Ciencia de datos quirúrgicos: de los conceptos a la traducción clínica. Medicina. Anal de imagen. 76, 102306 (2022).

Artículo PubMed Google Académico

Rau, A. et al. Adaptación de dominio implícita con redes antagónicas generativas condicionales para la predicción de profundidad en endoscopia. En t. J. Cómputo. Asistir. Radiol. Cirugía 14, 1167–1176 (2019).

Artículo PubMed PubMed Central Google Académico

Shorten, C. & Khoshgoftaar, TM Una encuesta sobre el aumento de datos de imágenes para el aprendizaje profundo. J. Big Data 6, (2019).

Kassem, H. et al. Ciclismo Federado (FedCy): Aprendizaje Federado Semi-supervisado de las fases quirúrgicas. Preimpresión en: https://arxiv.org/abs/2203.07345 (2022).

Taleb, A. et al. Métodos 3D autosupervisados ​​para imágenes médicas. En Actas de la 34.ª Conferencia internacional sobre sistemas de procesamiento de información neuronal (págs. 18158–18172) (2020).

Yu, T., Mutter, D., Marescaux, J. & Padoy, N. Aprendiendo de un pequeño conjunto de datos de anotaciones manuales: un enfoque de maestro/estudiante para el reconocimiento de la fase quirúrgica. Preimpresión en: https://arxiv.org/abs/1812.00033 (2018).

Shi, X., Jin, Y., Dou, Q. y Heng, P.-A. Aprendizaje semisupervisado con excavación progresiva de datos sin etiquetar para el reconocimiento del flujo de trabajo quirúrgico con etiquetas eficientes. Medicina. Anal de imagen. 73, 102158 (2021).

Artículo PubMed Google Académico

Zhang, J., Sheng, VS, Li, T. y Wu, X. Mejora de la calidad de las etiquetas de colaboración colectiva mediante la corrección de ruido. Trans. IEEE. Red neuronal Aprender. sist. 29, 1675–1688 (2018).

Artículo PubMed Google Académico

Nwoye, CI, Mutter, D., Marescaux, J. & Padoy, N. Enfoque LSTM convolucional débilmente supervisado para el seguimiento de herramientas en videos laparoscópicos. En t. J. Cómputo. Asistir. Radiol. Cirugía 14, 1059–1067 (2019).

Artículo PubMed Google Académico

Deng, J. et al. ImageNet: Una base de datos de imágenes jerárquicas a gran escala. En 2009 Conferencia IEEE sobre Visión por Computador y Reconocimiento de Patrones (IEEE, 2009). https://doi.org/10.1109/cvpr.2009.5206848.

Reyes, M. et al. Sobre la interpretabilidad de la inteligencia artificial en radiología: Desafíos y oportunidades. Radio. Artefacto Intel. 2, e190043 (2020).

Artículo Google Académico

Castro, DC, Walker, I. & Glocker, B. Asuntos de causalidad en imágenes médicas. Nat. común 11, 3673 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Liu, X. et al. La auditoría algorítmica médica. Lancet Digit Health 4, e384–e397 (2022).

Artículo PubMed Google Académico

Sun, L., Jiang, X., Ren, H. & Guo, Y. Edge-cloud computing e inteligencia artificial en Internet de las cosas médicas: arquitectura, tecnología y aplicación. Acceso IEEE 8, 101079–101092 (2020).

Artículo Google Académico

Gerke, S., Minssen, T. & Cohen, G. Desafíos éticos y legales de la atención médica impulsada por inteligencia artificial. En Inteligencia artificial en el cuidado de la salud 295–336 (Elsevier, 2020).

Gallant, J.-N., Brelsford, K., Sharma, S., Grantcharov, T. y Langerman, A. Percepciones de los pacientes sobre la grabación de audio y video en el quirófano. Ana. Cirugía https://doi.org/10.1097/SLA.0000000000004759 (2021).

Gichoya, JW et al. Reconocimiento de IA de la raza del paciente en imágenes médicas: un estudio de modelado. Lancet Digit Health 4, e406–e414 (2022).

Artículo PubMed Google Académico

Pierson, E., Cutler, DM, Leskovec, J., Mullainathan, S. y Obermeyer, Z. Un enfoque algorítmico para reducir las disparidades de dolor inexplicables en poblaciones desatendidas. Nat. Medicina. 27, 136–140 (2021).

Artículo CAS PubMed Google Académico

Reznick, R. et al. Informe del grupo de trabajo sobre inteligencia artificial y tecnologías digitales emergentes. Publicado en: https://www.royalcollege.ca/rcsite/documents/health-policy/rc-ai-task-force-e.pdf (2021).

La revisión de topol: educación sanitaria del NHS de Inglaterra. The Topol Review — NHS Health Education England. Publicado en: https://topol.hee.nhs.uk/ (2019).

Descargar referencias

Este trabajo fue apoyado parcialmente por fondos estatales franceses administrados por ANR con las referencias ANR-20-CHIA-0029-01 (Presidente Nacional de AI AI4ORSafety) y ANR-10-IAHU-02 (IHU Strasbourg). Este trabajo ha recibido financiación del programa de investigación e innovación Horizonte 2020 de la Unión Europea en el marco del acuerdo de subvención Marie Sklodowska-Curie No 813782 - proyecto ATLAS.

Estos autores contribuyeron igualmente: Pietro Mascagni, Deepak Alapatt.

Hospital Gemelli, Universidad Católica del Sagrado Corazón, Roma, Italia

Pedro Mascagni

IHU-Strasbourg, Instituto de Cirugía Guiada por Imágenes, Estrasburgo, Francia

Pietro Mascagni y Nicolás Padoy

Colaboración global de inteligencia artificial quirúrgica, Toronto, ON, Canadá

[ PubMed ] 10. Pietro Mascagni, Maria S. Altieri, Amin Madani, Yusuke Watanabe, Adnan Alseidi y Daniel A. Hashimoto

ICube, Universidad de Estrasburgo, CNRS, IHU, Estrasburgo, Francia

Deepak Alapatt, Luca Sestini y Nicholas Padoy

Departamento de Electrónica, Información y Bioingeniería, Politecnico di Milano, Milán, Italia

luca sestini

Departamento de Cirugía, Facultad de Medicina Perelman de la Universidad de Pensilvania, Filadelfia, Pensilvania, EE. UU.

Maria S. Altieri & Daniel A. Hashimoto

Departamento de Cirugía, University Health Network, Toronto, ON, Canadá

Amin Madani

Departamento de Cirugía, Universidad de Hokkaido, Hokkaido, Japón

yusuke watanabe

Departamento de Cirugía, Universidad de California San Francisco, San Francisco, CA, EE. UU.

adnan alseidi

Departamento de Cirugía, AdventHealth-Celebration Health, Celebration, FL, EE. UU.

Jay A. Redan

Fundación Hospital Universitario A. Gemelli IRCCS, Roma, Italia

Sergio Alfieri, Guido Costamagna & Ivo Boškoski

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

PM: Concepción y diseño, redacción y revisión sustancial. DA: Concepción y diseño, redacción y revisión sustancial. LS: Concepción y diseño, redacción y revisión sustancial. MSA: Diseño, redacción y revisión sustancial. AM: Diseño, revisión sustancial. YW: Diseño, revisión sustancial. AA: Diseño, revisión sustancial. JR: Diseño, revisión sustancial. SA: Diseño, revisión sustancial. GC: Diseño, revisión sustancial. IB: Diseño, revisión sustancial. NP: Concepción y diseño, revisión sustancial. DAH: Concepción y diseño, redacción y revisión sustancial. Todos los autores han aprobado la versión presentada y aceptan ser personalmente responsables del trabajo. PM y DA contribuyeron por igual y comparten la primera coautoría.

Correspondencia a Pietro Mascagni.

Los autores declaran los siguientes intereses financieros en competencia: AM es consultor de Activ Surgical y Genesis MedTech. NP es asesor científico de Caresyntax y su laboratorio recibe una beca de doctorado de Intuitive Surgical. DAH es consultor del Instituto Johnson & Johnson y Activ Surgical. Anteriormente recibió apoyo para investigación de Olympus Corporation. Los autores también declaran los siguientes intereses no financieros en competencia: PM, MSA, AM, YW, AA y DAH forman parte de la junta directiva de Global Surgical AI Collaborative, una organización sin fines de lucro que supervisa una plataforma de análisis e intercambio de datos. para datos quirúrgicos.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Mascagni, P., Alapatt, D., Sestini, L. et al. Visión artificial en cirugía: del potencial al valor clínico. npj Dígito. Medicina. 5, 163 (2022). https://doi.org/10.1038/s41746-022-00707-5

Descargar cita

Recibido: 15 julio 2022

Aceptado: 10 de octubre de 2022

Publicado: 28 de octubre de 2022

DOI: https://doi.org/10.1038/s41746-022-00707-5

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

npj Medicina digital (2023)