Künstliche Intelligenz (KI) nimmt in unserem Leben eine immer wichtigere Rolle ein und hat sich als vielversprechend erwiesen, wenn es darum geht, einige der größten aktuellen und künftigen gesellschaftlichen Herausforderungen zu bewältigen. Das Gesundheitswesen, obwohl bekanntermaßen komplex und störungsresistent, kann vom Einsatz der KI potenziell sehr profitieren. Die Radiologie ist seit jeher führend in der digitalen Transformation des Gesundheitswesens und hat einen dringenden Bedarf an verbesserter Effizienz, weshalb sie bei der Nutzung des KI-Potenzials eine Vorreiterrolle spielt.
Dieses E-Book zeigt auf, wie und warum KI die Herausforderungen in radiologischen Abteilungen bewältigen kann. Es gibt einen Überblick über die grundlegenden Konzepte der KI und beschreibt einige der vielversprechendsten Anwendungsfälle für KI in der Radiologie. Darüber hinaus werden die größten Herausforderungen im Zusammenhang mit der Einführung von KI in den radiologischen Alltag erörtert. Beleuchtet werden außerdem einige wichtige Aspekte, welche radiologische Abteilungen bei der Entscheidung über die Anschaffung KI-basierter Lösungen berücksichtigen sollten. Zuletzt bietet es einen Ausblick darauf, welche neuen und sich entwickelnden Aspekte der KI in der Radiologie in naher Zukunft zu erwarten sind.
Warum künstliche Intelligenz in der Radiologie? Einige Argumente für künstliche Intelligenz in der Radiologie
Das Gesundheitswesen hat in den letzten Jahrzehnten eine Reihe von Trends erlebt, die einen Wandel in der Art und Weise, wie bestimmte Dinge getan werden, erfordern. Diese Trends sind vor allem in der Radiologie zu beobachten, wo sich die diagnostische Qualität der Bildgebungsscans drastisch verbessert haben, während die Scanzeiten gesunken sind. Infolgedessen haben die Menge und die Komplexität der erfassten medizinischen Bildgebungsdaten in den letzten Jahrzehnten erheblich zugenommen (Smith-Bindman et al., 2019; Winder et al., 2021) und werden voraussichtlich weiter zunehmen (Tsao, 2020). Dieses Problem wird durch einen weit verbreiteten weltweiten Mangel an Radiologen erschwert (AAMC Report Reinforces Mounting Physician Shortage, 2021, Clinical Radiology UK Workforce Census 2019 Report, 2019). Beschäftigte im Gesundheitswesen, einschließlich Radiologen, haben eine zunehmende Arbeitsbelastung (Bruls & Kwee, 2020; Levin et al., 2017), die zu Burnout und medizinischen Fehlern beiträgt (Harry et al., 2021). Da die Radiologie ein wesentlicher Dienstleister für praktisch alle anderen Krankenhausabteilungen ist, hat ein Personalmangel in der Radiologie eine erhebliche und weitreichende Auswirkung, die sich auf das gesamte Krankenhaus und die Gesellschaft als Ganzes niederschlägt (England & Improvement, 2019; Sutherland et al., n.d.).
Angesichts der alternden Weltbevölkerung und die zunehmenden Belastung durch chronische Krankheiten dürften diese Probleme künftig sogar noch mehr Herausforderungen für das Gesundheitswesen mit sich bringen.
KI-basierte Lösungen für die medizinische Bildgebung haben aus verschiedenen Gründen das Potenzial, diese Herausforderungen zu bewältigen. Sie eignen sich insbesondere für die Bearbeitung großer, komplexer bzw. digitaler Datensätze (Alzubaidi et al., 2021). Darüber hinaus eignen sie sich gut dafür, einige der Aufgaben zu automatisieren, die traditionell von Radiologen und Radiologieassistenten ausgeführt werden, wodurch Zeit eingespart und die Arbeitsabläufe in radiologischen Abteilungen effizienter gestaltet werden könnten (Allen et al., 2021; Baltruschat et al., 2021; Kalra et al., 2020; O‘Neill et al., 2021; van Leeuwen et al., 2021; Wong et al., 2019). KI ist auch in der Lage, komplexe Muster und Zusammenhänge in Daten zu erkennen, die dem menschlichen Betrachter eventuell verborgen bleiben oder nicht unbedingt zu finden oder zu quantifizieren sind (Dance, 2021; Korteling et al., 2021; Kühl et al., 2020).
Grundlagen der künstlichen Intelligenz
Der Begriff „künstliche Intelligenz“ bezieht sich auf den Einsatz von Computersystemen zur Lösung bestimmter Probleme in einer Art und Weise, die das menschliche Denken simuliert. Ein grundlegendes Merkmal der künstlichen Intelligenz ist, dass entsprechende Systeme ihre Lösungen an veränderte Umstände – ähnlich wie Menschen - anpassen können. Zwar sollen diese Systeme auf einer grundlegenden Ebene das menschliche Denken nachahmen, aber ihre Fähigkeit, dies zu tun z. B. in Bezug auf die Datenmenge, die sie gleichzeitig verarbeiten können, die Art und Menge der Muster, die sie in den Daten finden können, und die Geschwindigkeit, mit der sie dies tun, übersteigt natürlich die des Menschen.
KI-Lösungen kommen in Form von Computeralgorithmen, d. h. von Computercode, der Anweisungen enthält, die zur Lösung eines bestimmten Problems auf die Daten angewendet werden müssen. In seiner grundlegendsten Form nimmt der Algorithmus Daten als Eingabe, führt eine Berechnung mit diesen Daten durch und gibt eine Ausgabe zurück. Ein KI-Algorithmus kann explizit für die Lösung einer bestimmten Aufgabe programmiert werden, analog zu einem Schritt-für-Schritt-Rezept zum Backen eines Kuchens. Andererseits kann der Algorithmus auch so programmiert werden, dass er in den Daten nach Mustern sucht, um das Problem zu lösen. Diese Arten von Algorithmen werden als maschinelles Lernen bezeichnet. Alle Algorithmen für maschinelles Lernen sind also KI, aber nicht jede KI ist maschinelles Lernen. Die Muster in den Daten, auf die ein Algorithmus explizit programmiert wurde bzw. die er selbst „entdecken“ kann, werden als Merkmale bezeichnet. Ein wichtiges Merkmal des maschinellen Lernens ist, dass solche Algorithmen aus den Daten selbst lernen und ihre Leistung umso besser wird, je mehr Daten sie erhalten..
Eine der häufigsten Anwendungen des maschinellen Lernens ist die Klassifizierung, d. h. die Zuweisung einer bestimmten Bezeichnung für einen Datensatz. So kann ein Algorithmus für maschinelles Lernen beispielsweise feststellen, ob ein Foto (die Eingabe) einen Hund oder eine Katze (die Bezeichnung) zeigt. Der Algorithmus kann dies auf überwachte oder unüberwachte Weise erlernen.
Überwachtes Lernen
Beim überwachten Lernen erhält der Algorithmus für maschinelles Lernen Daten, die mit der Grundwahrheit gekennzeichnet wurden. In diesem Beispiel handelt es sich um Fotos von Hunden und Katzen, die als solche gekennzeichnet wurden. Der Prozess durchläuft dann die folgenden Phasen:
1.Trainingsphase: Der Algorithmus lernt die mit Hunden und Katzen verbundenen Merkmale anhand der oben genannten Daten (Trainingsdaten).
2.Testphase:Der Algorithmus erhält dann einen neuen Satz von Fotos (die Testdaten), welche er selbst beschriftet. Die Genauigkeit dieser eigenen Klassifizierungbewertet dann die Leistung des Algorithmus mit diesen Daten.
In einigen Fällen gibt es eine Phase zwischen Training und Test, die als Validierungsphase bezeichnet wird. In dieser Phase erhält der Algorithmus einen neuen Satz von Fotos (die weder zu den Trainings- noch zu den Testdaten gehören), seine Leistung wird anhand dieser Daten bewertet, und das Modell wird optimiert und anhand der Trainingsdaten neu trainiert. Dies wird so lange wiederholt, bis ein vordefiniertes Leistungskriterium erreicht ist. Anschließend geht der Algorithmus in die Testphase über.
Unüberwachtes Lernen
Beim unüberwachten Lernen identifiziert der Algorithmus Merkmale in den Eingabedaten, die es ihm ermöglicht, den einzelnen Datenpunkten Klassen zuzuordnen, ohne dass ihm explizit mitgeteilt wird, welche Klassen dies sind oder sein sollten. Solche Algorithmen können Muster erkennen oder Datenpunkte ohne menschliches Eingreifen gruppieren. Somit sind z.B. umfassende Clusterbildung bzw. Reduktion in der Datendimension möglich. Nicht alle Algorithmen für maschinelles Lernen führen eine Klassifizierung durch. Einige werden verwendet, um eine kontinuierliche Metrik (z. B. die Temperatur in vier Wochen) anstelle einer diskreten Kennzeichnung (z. B. Katzen oder Hunde) vorherzusagen. Diese sind als Regressionsalgorithmen bekannt.
Neuronale Netzwerke und Deep Learning
Ein neuronales Netzwerk besteht aus einer Eingabeschicht und einer Ausgabeschicht, die jeweils über Knotenpunkten verbunden sind. Bei einfachen neuronalen Netzwerken werden Merkmale, die manuell von einem Datensatz abgeleitet werden, in die Eingabeschicht eingespeist. Diese führt einige Berechnungen durch, deren Ergebnisse in die Ausgabeschicht weitergeleitet werden. Bei Deep Learning gibt es mehrere „verborgene“ Schichten zwischen der Eingabe- und der Ausgabeschicht. Jeder Knoten einer verborgenen Schicht führt Berechnungen unter Verwendung bestimmter Gewichtungen durch und leitet die Ausgabe an die nächste verborgene Schicht weiter, bis die Ausgabeschicht erreicht ist.
Zu Beginn werden den Gewichten zufällige Werte zugewiesen, und die Genauigkeit des Algorithmus wird berechnet. Die Werte der Gewichtungen werden dann iterativ angepasst, bis ein Satz von Gewichtungswerten gefunden ist, der die Genauigkeit maximiert. Diese iterative Anpassung der Gewichtungswerte erfolgt in der Regel durch Rückwärtsbewegung von der Ausgabeschicht zur Eingabeschicht, eine Technik, die Backpropagation genannt wird. Dieser gesamte Prozess wird mit den Trainingsdaten durchgeführt.
Leistungsbewertung
Für die Interpretation von KI- und deren Ergebnissen ist es wichtig zu verstehen, wie die Leistung von KI-Algorithmen bewertet wird. Es gibt mehrere Leistungsmetriken, mit denen bewertet werden kann, wie gut ein Modell bestimmte Aufgaben erfüllt. Keine einzelne Kennzahl ist perfekt, so dass eine Kombination aus mehreren Kennzahlen ein umfassenderes Bild der Modellleistung ergibt.
Im Bereich der Regression werden folgende Metriken am häufigsten verwendet:
R2: Die folgenden Metriken werden üblicherweise bei Klassifizierungsaufgaben verwendet:
- Mittlerer absoluter Fehler (MAE): die durchschnittliche Differenz zwischen den vorhergesagten Werten und der Basiswahrheit.
- Root Mean Square Error (RMSE): Die Differenzen zwischen den vorhergesagten Werten und der Basiswahrheit werden quadriert und dann über die Stichprobe gemittelt. Dann wird die Quadratwurzel aus dem Mittelwert gezogen. Im Gegensatz zum MAE werden beim RMSE größere Differenzen stärker gewichtet.
R2: der Anteil der Gesamtvarianz in der Basiswahrheit, der durch die Varianz in den vorhergesagten Werten erklärt wird. Er reicht von 0 bis 1. Die folgenden Metriken werden üblicherweise bei Klassifizierungsaufgaben verwendet:
- Genauigkeit: Dies ist der Anteil aller Vorhersagen, die richtig vorhergesagt wurden. Sie reicht von 0 bis 1.
- Sensitivität: Auch bekannt als Wahr-Positiv-Rate (TPR) oder Recall, ist dies der Anteil der wahren Positiven, die richtig vorhergesagt wurden. Sie reicht von 0 bis 1.
- Spezifität: Dies ist der Anteil der wahrhaftig negativen Ergebnisse, die richtig vorhergesagt wurden, auch bekannt als TNR (true negative rate). Sie liegt zwischen 0 und 1.
- Präzision: Auch bekannt als positiver prädiktiver Wert (PPV), dies ist der Anteil der positiven Klassifizierungen, die korrekt vorhergesagt wurden. Der Wert liegt zwischen 0 und 1.
Zwischen Sensitivität und Spezifität besteht ein inhärenter Zielkonflikt. Die Bedeutung der beiden Faktoren sowie ihre Interpretation hängen in hohem Maße von der jeweiligen Forschungsfrage und Klassifizierungsaufgabe ab.
Wichtig ist, dass Klassifizierungsmodelle, obwohl sie eine binäre Schlussfolgerung ziehen sollen, von Natur aus wahrscheinlichkeitsbasiert sind. Das bedeutet, dass diese Modelle eine Wahrscheinlichkeit ausgeben, dass ein Datenpunkt zu der einen oder anderen Klasse gehört. Um eine Aussage über die wahrscheinlichste Klasse zu treffen, wird ein Schwellenwert verwendet. Metriken wie Genauigkeit, Sensitivität, Spezifität und Präzision beziehen sich auf die Leistung des Algorithmus auf der Grundlage eines bestimmten Schwellenwerts. Die Fläche unter der Receiver Operating Characteristic Curve (ROC) ist eine schwellenunabhängige Leistungskennzahl. Die ROC kann als die Wahrscheinlichkeit interpretiert werden, dass ein zufälliges positives Beispiel vom Algorithmus höher eingestuft wird als ein zufälliges negatives Beispiel.
In der Bildsegmentierung, einer Art der Klassifikation, kommen in der Regel die folgenden Metriken zum Einsatz:
- Dice Similarity Coefficient (DSC) / Würfelähnlichkeitskoeffizient: Grad der Überlappung zwischen zwei Datensätzen (z. B. zwei Bildern), berechnet als das Zweifache der Anzahl an Elementen, die beide Datensätzen gemeinsam haben, dividiert durch die Summe der Anzahl an Elementen in jedem Datensatz. Diese Kennzahl kann Werte von 0 (keine Überlappung) bis 1 (perfekte Überlappung) annehmen.
- Hausdorff-Distanz: ein Maß, wie weit zwei Datensätze (z. B. zwei Bilder) innerhalb eines Bereichs voneinander entfernt sind. Im Grunde handelt es sich um die maximale Distanz zwischen einem Punkt in einem Datensatz und dem am nächsten gelegenen Punkt in dem anderen Datensatz Interne und externe Validität
Intern valide Modelle bewähren sich bei Daten, die für das Training und zur Validierung eingesetzt werden.
Der Grad ihrer internen Validität wird unter Heranziehung der vorstehend genannten Leistungsmetriken bewertet und hängt von den Eigenschaften des Modells selbst und der Qualität der Daten ab, mit denen das Modell trainiert und validiert wurde.
Extern valide Modelle bewähren sich bei neuen Daten (Ramspek et al., 2021). Je besser ein Modell mit Daten funktioniert, die von denjenigen Daten abweichen, mit denen die Modelle trainiert und validiert wurden, desto höher ist die externe Validität. In der Praxis muss hierfür oftmals die Leistung der Modelle anhand von Datensätzen aus anderen Krankenhäusern oder sogar landesspezifischen Regionen getestet werden, die nicht Bestandteil der Datensätze aus der Trainings- und Validierungsphase waren.
Leitlinien für die Einschätzung von KI-Forschung
Mehrere Leitlinien befassen sich mit der Evidenzbeurteilung KI-basierter Anwendungen im Gesundheitswesen (X. Liu et al., 2020; Mongan et al., 2020; Shelmerdine et al., 2021; Weikert et al., 2021). Sie bieten eine Vorlage für diejenigen, die sich mit KI-Forschung im Gesundheitswesen befassen, und stellen sicher, dass die entsprechenden Informationen transparent und umfassend weitergegeben werden. Sie können jedoch auch von anderen Stakeholdern verwendet werden, um die Qualität von Forschungspublikationen einzuschätzen. So kann verhindert werden, dass KI-basierte Lösungen mit substanziellem Potenzial oder tatsächlichen Einschränkungen, insbesondere aufgrund schlechter Befundberichte (Bozkurt et al., 2020; D. W. Kim et al., 2019; X. Liu et al., 2019; Nagendran et al., 2020; Yusuf et al., 2020), verfrüht zum Einsatz kommen (CONSORT-AI and SPIRIT-AI Steering Group, 2019). Weitere Leitlinien befassen sich mit der Beurteilung der Vertrauenswürdigkeit KI-basierter Lösungen hinsichtlich Transparenz, Vertraulichkeit, Sicherheit und Verantwortung (Buruk et al., 2020; Lekadir et al., 2021; Zicari et al., 2021).
Klinische Anwendung
In den letzten Jahren hat KI großes Potenzial bei der Bewältigung eines breiten Spektrums von Aufgaben im Bereich Radiologie und medizinischer Bildgebunggezeigt. Darunter viele in Bereichen, die vor dem Scannen des Patienten anfallen. Implementierungen von KI zur Verbesserung der Effizienz radiologischer Arbeitsabläufe vor dem Scannen des Patienten werden manchmal als „vorgelagerte KI“ bezeichnet (Kapoor et al., 2020; M. L. Richardson et al., 2021).
Terminplanung
Eine vielversprechende vorgelagerte KI-Anwendung ist die Vorhersage, welche Patienten wahrscheinlich ihre Untersuchungstermine verpassen bzw. nicht wahrnehmen werden. Verpasste Termine sind mit einem deutlich höheren Arbeitsaufwand und höheren Kosten verbunden (Dantas et al., 2018). Mithilfe eines Gradient-Boosting-Ansatzes sagten Nelson et al. im National Health Service (NHS) des Vereinigten Königreichs verpasste Termine für Magnetresonanztomografien (MRT) mit hoher Genauigkeit voraus (Nelson et al., 2019). Ihre Simulationen legten auch nahe, dass die Umsetzung der Vorhersagen dieses Modells durch die gezielte Ansprache von Patienten, die ihre Termine wahrscheinlich versäumen, einen Nettonutzen von mehreren Pfund pro Termin über eine Reihe von Modellschwellenwerten und Terminversäumnisraten hinwegbringen könnte (Nelson et al., 2019).
Ähnliche Ergebnisse wurden kürzlich in einer Studie in einem einzelnen Krankenhaus in Singapur gefunden. In den sechs Monaten nach der Einführung des Prognosetools konnte die Nichterscheinungsrate von 19,3% auf 15,9% deutlich gesenkt werden, was einen potenziellen wirtschaftlichen Nutzen von 180 000 USD bedeutet (Chong et al., 2020).
Die effiziente Planung von Untersuchungen in einer radiologischen Abteilung ist ein schwieriges Unterfangen, denn obwohl es sich dabei weitgehend um eine Verwaltungsaufgabe handelt, hängt diese stark von medizinischen (Vor-)Informationen ab. Die Zuweisung von Patienten zu bestimmten Terminen erfordert daher häufig die Mitwirkung einer Person mit Fachwissen. Das bedeutet, dass entweder die Person, die die Termine vergibt, ein Radiologe oder ein Radiologieassistent sein muss, bzw. eine Personen, die in dem Bereich sehr gut ausgebildet ist. In beiden Fällen ist der Prozess etwas ineffizient und kann potenziell durch KI-basierte Algorithmen gestrafft werden, indem die Scan-Indikationen und Kontraindikationen geprüft und die Personen, welche die Untersuchung planen, mit Informationen über die Dringlichkeit der Scans versorgen (Letourneau-Guillon et al., 2020).
Protokollauswahl
Je nach den Richtlinien des Krankenhauses oder der Klinik wird die Entscheidung, welches Untersuchungsprotokoll ein Patient erhält, in der Regel auf der Grundlage der Informationen in der Untersuchungsanforderung des überweisenden Arztes und der Expertiese des Radiologen getroffen. Ergänzt wird dies häufig durch eine direkte Kommunikation zwischen dem überweisenden Arzt und dem Radiologen sowie durch die Überprüfung der medizinischen Daten des Patienten durch den Radiologen. Dieser Prozess verbessert die Patientenversorgung (Boland et al., 2014), kann aber zeitaufwändig und ineffizient sein, insbesondere bei Modalitäten wie der MRT, bei der eine große Anzahl an unterschiedlichen Protokollen für verschiedenste Fragestellungen existiert. In einer Studie machte allein die Protokollierung bzw. Dokumentation etwa 6% der Arbeitszeit des Radiologen aus (Schemmelet al., 2016). Radiologen werden auch häufig durch Aufgaben wie die Protokollierung bei der Bildinterpretation unterbrochen, obwohl letztere als primäre Aufgabe eines Radiologen gilt (Balint et al., 2014; J.-P. J. Yu et al., 2014).
Die Interpretation des narrativen Textes der Scan-Anforderung des überweisenden Arztes wurde mit Hilfe von Klassifikatoren für natürliche Sprache versucht, der gleichen Technologie, die in Chatbots und virtuellen Assistenten verwendet wird. Natürlichsprachliche Klassifikatoren, die auf Deep Learning basieren, haben sich als vielversprechend erwiesen, wenn es darum geht, Patienten entweder einem kontrastverstärkten oder einem nicht kontrastverstärkten MRT-Protokoll für die MRT des Bewegungsapparats zuzuordnen, und zwar mit einer Genauigkeit von 83% (Trivedi et al., 2018) und 94% (Y. H. Lee, 2018). Ähnliche Algorithmen haben eine Genauigkeit von 95% bei der Vorhersage des geeigneten MRT-Protokolls für das Gehirn unter Verwendung einer Kombination von bis zu 41 verschiedenen MRT-Sequenzen gezeigt (Brown & Marotta, 2018). Für eine breite Palette von Körperregionen entschied ein Deep-Learning-basierter Klassifikator für natürliche Sprache auf der Grundlage des narrativen Textes der Scananfragen, ob er automatisch ein bestimmtes Computertomographie- (CT) oder MRT-Protokoll zuweisen sollte (was er mit 95% Genauigkeit tat) oder in schwierigeren Fällen dem Radiologen eine Liste mit drei am besten geeigneten Protokollen empfehlen sollte (was er mit 92% Genauigkeit tat) (Kalra et al., 2020).
KI wurde auch eingesetzt, um zu entscheiden, ob bereits protokollierte Scans erweitert werden müssen, eine Entscheidung, die in Echtzeit getroffen werden muss, während sich der Patient im Scanner befindet. Ein solches Beispiel ist die Prostata-MRT, bei der die Entscheidung über die Verabreichung eines Kontrastmittels häufig nach den kontrastfreien Sequenzen getroffen wird. Hötker et al. fanden heraus, dass ein neuronales Faltungsnetzwerk (CNN) 78% der Patienten dem geeigneten Prostata-MRT-Protokoll zuordnete (Hötker et al., 2021). Die Sensitivität des CNN für die Notwendigkeit eines Kontrastmittels betrug 94,4% bei einer Spezifität von 68,8% , und nur 2% der Patienten in ihrer Studie hätten zu einer kontrastverstärkten Untersuchung zurückgerufen werden müssen (Hötker et al., 2021).
Verbesserung und Überwachung der Bildqualität
In letzter Zeit wurden viele KI-basierte Lösungen entwickelt, die im Hintergrund der radiologischen Arbeitsabläufe arbeiten und die Bildqualität verbessern. Dazu gehören Lösungen zur Überwachung der Bildqualität, zur Reduzierung von Bildartefakten, zur Verbesserung der räumlichen Auflösung und zur Beschleunigung von Scans.
Solche Lösungen halten Einzug in die Radiologie, insbesondere in der Computertomografie, wo jahrzehntelang etablierte, aber artefaktanfällige Methoden zur Rekonstruktion interpretierbarer Bilder aus den Rohdaten verwendet wurden (Deák et al., 2013; Singh et al., 2010).
Diese werden allmählich durch Deep-Learning-basierte Rekonstruktionsmethoden ersetzt, die die Bildqualität verbessern und gleichzeitig die Strahlendosis niedrig halten (Akagi et al., 2019; H. Chen et al., 2017; Choe et al., 2019; Shan et al., 2019). Diese Rekonstruktion wird auf Computern auf dem CT-Scanner selbst oder in der Cloud durchgeführt. Das Gleichgewicht zwischen Strahlendosis und Bildqualität kann protokollspezifisch angepasst werden, um Scans auf einzelne Patienten und klinische Szenarien zuzuschneiden (McLeavy et al., 2021; Willemink & Noël, 2019). Solche Ansätze haben sich insbesondere beim Scannen von Kindern, Schwangeren und adipösen Patienten sowie bei CT-Scans der Harnwege und des Herzens bewährt (McLeavy et al., 2021).
KI-basierte Lösungen wurden auch eingesetzt, um Scans zu beschleunigen und gleichzeitig die diagnostische Qualität zu erhalten. Die Verkürzung der Scanzeiten verbessert nicht nur die Gesamteffizienz, sondern trägt auch zu einer insgesamt besseren Patientenerfahrung und Compliance bei bildgebenden Untersuchungen bei. Eine von mehreren Zentren durchgeführte Studie zur Wirbelsäulen-MRT zeigte, dass ein auf Deep Learning basierender Bildrekonstruktionsalgorithmus, der Bilder durch Filterung und detailerhaltende Rauschunterdrückung verbesserte, die Scanzeiten um 40% reduzierte (Bash, Johnson, et al., 2021). Bei T1-gewichteten MRT-Scans des Gehirns verringerte ein ähnlicher Algorithmus, der die Bildschärfe verbessert und das Bildrauschen reduziert, die Scanzeiten um 60% , wobei die Genauigkeit der Volumetrie der Hirnregionen im Vergleich zu Standardscans erhalten blieb (Bash, Wang, et al., 2021).
In der täglichen Routine enthalten Bilder häufig Artefakte, die ihre Interpretierbarkeit beeinträchtigen. Diese Artefakte sind das Ergebnis von Merkmalen der spezifischen Bildgebungsmodalität oder des verwendeten Protokolls oder von Faktoren, die dem gescannten Patienten eigen sind, wie das Vorhandensein von Fremdkörpern oder die Bewegung des Patienten während des Scans. Insbesondere bei der MRT führen Bildgebungsprotokolle, die ein schnelles Scannen erfordern, häufig zu bestimmten Artefakten im rekonstruierten Bild. In einer Studie reduzierte ein auf Deep Learning basierender Algorithmus Banding-Artefakte, die mit entsprechenden Sequenzen für das Gehirn und des Knies verbunden sind (K. H. Kim & Park, 2017). Bei der Echtzeit-Bildgebung des Herzens mittels MRT wurde in einer anderen Studie festgestellt, dass die durch die Unterabtastung der Daten verursachten Aliasing-Artefakte durch einen Deep-Learning-basierten Ansatz reduziert wurden (Hauptmann et al., 2019). Das Vorhandensein von metallischen Fremdkörpern wie zahnmedizinischen, orthopädischen oder vaskulären Implantaten ist ein häufiger patientenbezogener Faktor, der sowohl in der CT als auch in der MRT Bildartefakte verursacht (Boas & Fleischmann, 2012; Hargreaves et al., 2011). Obwohl noch nicht gut etabliert, wurden mehrere Deep-Learning-basierte Ansätze zur Reduzierung dieser Artefakte untersucht (Ghani & Clem Karl, 2019; Puvanasunthararajah et al., 2021; Zhang & Yu, 2018). Ähnliche Ansätze werden derzeit zur Reduzierung von bewegungsbedingten Artefakten in der MRT getestet (Tamada et al., 2020; B. Zhao et al., 2022).
KI-basierte Lösungen zur Überwachung der Bildqualität könnten die Notwendigkeit verringern, wiederholte Aufnahmen des Patienten durchzuführen, was ein häufiges Problem darstellt (Schreiber-Zinaman & Rosenkrantz, 2017). Ein Deep-Learning-basierter Algorithmus, der die aufgenommene Röntgenansicht identifiziert und qualitätsbezogene Metriken aus Röntgenbildern des Sprunggelenks extrahiert, konnte die Bildqualität mit einer Genauigkeit von etwa 94% vorhersagen (Mairhöfer et al., 2021). Ein anderer Deep-Learning-basierter Ansatzwar in der Lage, nicht-diagnostische Leber-MRT-Scans mit einem negativen Vorhersagewert zwischen 86% und 94% vorherzusagen (Esses et al., 2018). Diese automatisierte Qualitätskontrolle in Echtzeit ermöglicht es Radiologieassistenten, Scans zu wiederholen oder zusätzliche Scans mit einem höherem diagnostischen Wert durchzuführen.
Befundungspriorisierung
Angesichts von Personalknappheit und steigenden Untersuchungszahlen sehen sich Radiologen mit langen Arbeitslisten konfrontiert. Um die Effizienz und die Patientenversorgung zu optimieren, wurden KI-basierte Lösungen vorgeschlagen, um Prioritäten zu setzen, welche Scans Radiologen zuerst lesen und befunden sollten, da sie evtl. einen dringenden Eingriff bzw. Behandlung erfordern (O‘Connor & Bhalla, 2021). Am ausführlichsten wurde dies in der Neuroradiologie untersucht, wo CT-Scans, bei denen ein KI-gestütztes Tool eine intrakranielle Blutung feststellte, an den Anfang der Arbeitsliste verschoben wurden, wodurch sich die Zeit, die Radiologen zum Betrachten der Scans benötigten, um mehrere Minuten verkürzte (O‘Neill et al., 2021). Eine andere Studie ergab, dass die Zeit bis zur Diagnose (welche die Zeit von der Bildaufnahme bis zur Sichtung durch den Radiologen und die Zeit zum Lesen und Berichten der Scans umfasst) in einem ambulanten Umfeld von 512 auf 19 Minuten reduziert wurde, wenn eine solche Arbeitslistenpriorisierung verwendet wurde (Arbabshirani et al., 2018). Eine Simulationsstudie, bei der eine KI-basierte Arbeitslistenpriorisierung auf der Grundlage der Identifizierung dringender Befunde auf Röntgenbildern des Brustkorbs (wie Pneumothorax, Pleuraergüsse und Fremdkörper) verwendet wurde, ergab ebenfalls eine erhebliche Verringerung der Zeit, die für die Betrachtung und Befundung der Scans im Vergleich zur Standard-Workflow-Priorisierung benötigt wurde (Baltruschat et al., 2021).
Bildauswertung
Derzeit konzentrieren sich die meisten kommerziell erhältlichen KI-basierten Lösungen für die medizinische Bildgebung auf bestimmte Aspekte der Bildanalyse und -interpretation (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021). Dazu gehören die Segmentierung von Bildteilen (z. B. für chirurgische Eingriffe oder Strahlentherapien), die Sensibilisierung von Radiologen für verdächtige Bereiche, die Extraktion von bildgebenden Biomarkern (Radiomics), der Vergleich von Bildern im Zeitverlauf und die Erstellung spezifischer Bilddiagnosen.
Neurologie
- 29–38% der kommerziell verfügbaren KI-basierten Anwendungen in der Radiologie (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021).
Bei Multipler Sklerose wurde die KI zur Identifizierung und Segmentierung von Läsionen eingesetzt (Nair et al., 2020; S.-H. Wang et al., 2018), was insbesondere für die longitudinale Nachsorge von Patienten hilfreich sein kann. Sie wurde auch eingesetzt, um Bildgebungsmerkmale zu extrahieren, die mit einem Fortschreiten der Krankheit und der Umwandlung eines klinisch isolierten Syndroms in eine definitive Multiple Sklerose einhergehen (Narayana et al., 2020; Yoo et al., 2019). Weitere Anwendungen der KI in der Neuroradiologie umfassen die Erkennung von intrakraniellen Aneurysmen (Faron et al., 2020; Nakao et al., 2018; Ueda et al., 2019) und die Segmentierung von Hirntumoren (Kao et al., 2019; Mlynarski et al., 2019; Zhou et al., 2020) sowie die Vorhersage von genetischen Markern für Hirntumore aus Bildgebungsdaten (Choi et al., 2019; J. Zhao et al., 2020).
Thorax
- 24%–31% der kommerziell verfügbaren KI basierten Anwendungen in der Radiologie (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
Bei der Interpretation von Thorax-Röntgenbildern erkannten Radiologen mit Hilfe eines Deep-Learning-basierten Algorithmus wesentlich mehr kritische und dringende Befunde, und zwar viel schneller als ohne den Algorithmus (Nam et al., 2021). Deep-Learning-basierte Bildinterpretationsalgorithmen verbesserten auch die Sensitivität von Assistenzärzten in der Radiologie bei der Erkennung dringender Befunde auf Thorax-Röntgenbildern von 66% auf 73% (E. J. Hwang, Nam, et al., 2019). Eine andere Studie, die sich auf ein breiteres Spektrum von Befunden auf Thorax-Röntgenbildern konzentrierte, ergab ebenfalls, dass Radiologen, die von einem Deep-Learning-basierten Algorithmus unterstützt wurden, eine höhere diagnostische Genauigkeit aufwiesen als Radiologen, die die Röntgenbilder ohne Unterstützung lasen (Seah et al., 2021). Der Einsatz von KI in der Thorax-Radiologie erstreckt sich auch auf Schnittbilder der CT. Ein Deep-Learning-Algorithmus konnte Lungenembolien auf CT-Scans mit hoher Genauigkeit (AUC = 0,85) erkennen (Huang, Kothari, et al., 2020). Darüber hinaus war ein Deep-Learning-Algorithmus bei der Erkennung einer Aortendissektion auf nicht kontrastverstärkten CT-Scans zu 90% genau, ähnlich wie die Leistung von Radiologen (Hata et al., 2021).
Außerhalb des Notfallsettings wurden KI-basierte Lösungen für das Tuberkulose-Screening auf Röntgenbildern des Brustkorbs umfassend getestet und umgesetzt (E. J. Hwang, Park, et al., 2019; S. Hwang et al., 2016; Khan et al., 2020; Qin et al., 2019; WHO Operational Handbook on Tuberculosis Module 2: Screening - Systematic Screening for Tuberculosis Disease, n.d.). Darüber hinaus haben sie sich beim Lungenkrebsscreening als nützlich erwiesen, sowohl bei der Erkennung von Lungenknötchen auf CT- (Setio et al., 2017) und Thorax-Röntgenbildern (Li et al., 2020) als auch bei der Klassifizierung, ob die Knötchen wahrscheinlich bösartig oder gutartig sind (Ardila et al., 2019; Bonavita et al., 2020; Ciompi et al., 2017; B. Wu et al., 2018). KI-basierte Lösungen sind auch sehr vielversprechend für die Diagnose von Lungenentzündungen, chronisch obstruktiven Lungenerkrankungen und interstitiellen Lungenerkrankungen (F. Liu et al., 2021).
Brust
- 11% der kommerziell verfügbaren KI-basierten Anwendungen in der Radiologie (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021).
Bislang zielen viele der KI-basierten Algorithmen für die Brustbildgebung darauf ab, die Arbeitsbelastung von Radiologen beim Lesen von Mammogrammen zu verringern. Zu den Möglichkeiten, dies zu erreichen, gehört der Einsatz von KI-basierten Algorithmen, um negative Mammogramme auszusortieren, was in einer Studie mit einer Verringerung der Arbeitsbelastung der Radiologen um fast ein Fünftel verbunden war (Yala et al., 2019). Andere Studien, in denen Zweitbefunder von Mammogrammen durch KI-basierte Algorithmen ersetzt wurden, haben gezeigt, dass dies zu weniger falsch-positiven und falsch-negativen Ergebnissen führt und die Arbeitsbelastung des Zweitbefunders um 88% reduziert (McKinney et al., 2020).
KI-basierte Lösungen für die Mammographie haben auch die Diagnosegenauigkeit von Radiologen erhöht (McKinney et al., 2020; Rodríguez-Ruiz et al., 2019; Watanabe et al., 2019), und einige von ihnen haben sich bei der unabhängigen Erkennung und Klassifizierung von Brustläsionen als sehr genau erwiesen (Agnes et al., 2019; Al-Antari et al., 2020; Rodriguez-Ruiz et al., 2019).
Dennoch ergab eine kürzlich durchgeführte systematische Überprüfung von 36 KI-basierten Algorithmen, dass diese Studien von schlechter methodischer Qualität waren und dass alle Algorithmen weniger genau waren als der Konsens von zwei oder mehr Radiologen (Freeman et al., 2021). KI-basierte Algorithmen haben jedoch das Potenzial gezeigt, über die mammografische Brustdichte hinaus krebsvorhersagende Merkmale aus Mammogrammen zu extrahieren (Arefan et al., 2020; Dembrower et al., 2020; Hinton et al., 2019). Über die Mammographie hinaus wurden KI-basierte Lösungen für die Erkennung und Klassifizierung von Brustläsionen im Ultraschall (Akkus et al., 2019; Park et al., 2019; G.- G. Wu et al., 2019) und MRT (Herent et al., 2019) entwickelt.
Herz
- 11% der kommerziell verfügbaren KI-basierten Anwendungen in der Radiologie (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
Die Herzradiologie war schon immer eine besondere Herausforderung, da es schwierig ist, Bilder eines sich ständig bewegenden Organs zu erfassen. Aus diesem Grund hat sie von den Fortschritten in der Bildgebungstechnologie enorm profitiert, und es scheint, dass sie auch von der KI stark profitieren wird (Sermesant et al., 2021). Die meisten KI-basierten Anwendungen für das kardiovaskuläre System verwenden MRT-, CT- oder Ultraschalldaten (Weikert et al., 2021). Prominente Beispiele sind die automatisierte Berechnung der Auswurffraktion bei der Echokardiographie, die Quantifizierung der Koronararterienverkalkung bei der Herz-CT, die Bestimmung des Volumens der rechten Herzkammer bei der CT-Pulmonalangiographie und die Bestimmung der Größe und Dicke der Herzkammern bei der Herz-MRT (Medical AI Evaluation, n.d., The Medical Futurist, n.d.). KI-basierte Lösungen für die Vorhersage von Patienten, die wahrscheinlich günstig auf kardiale Interventionen wie die kardiale Resynchronisationstherapie ansprechen, haben sich ebenfalls als vielversprechend erwiesen (Cikes et al., 2019; Hu et al., 2019). Veränderungen in der kardialen MRT, die für den menschlichen Betrachter nicht ohne Weiteres sichtbar sind, aber potenziell für die Unterscheidung verschiedener Arten von Kardiomyopathien nützlich sind, können auch mithilfe von KI durch Texturanalyse (Neisius et al., 2019; J. Wang et al., 2020) und andere radiomische Ansätze (Mancio et al., 2022) erkannt werden.
Bewegungsapparat
- 7–11% der kommerziell verfügbaren KI-basierten Anwendungen in der Radiologie (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
Zu den vielversprechenden Anwendungen von KI bei der Bewertung von Muskeln, Knochen und Gelenken gehören Anwendungen, bei denen Radiologen im Allgemeinen eine geringe Zuverlässigkeit ???, wie die Bestimmung des Skelettalters anhand von Röntgenaufnahmen (Halabi et al., 2019; Thodberg et al., 2009) und das Screening auf Osteoporose anhand von Röntgenaufnahmen (Kathirvelu et al., 2019; J.-S. Lee et al., 2019) und CT (Pan et al., 2020). KI-basierte Lösungen haben sich auch als vielversprechend für die Erkennung von Frakturen auf Röntgenbildern und CT-Aufnahmen erwiesen (Lindsey et al., 2018; Olczak et al., 2017; Urakawa et al., 2019). Eine systematische Überprüfung von KI-basierten Lösungen für die Frakturerkennung in verschiedenen Körperteilen ergab AUCs von 0,94 bis 1,00 und Genauigkeiten von 77% bis 98% (Langerhuizen et al., 2019). KI-basierte Lösungen haben auch bei der Klassifizierung des Schweregrads degenerativer Veränderungen der Wirbelsäule (Jamaludin et al., 2017) und der Extremitätengelenke (F. Liu et al., 2018; Thomas et al., 2020) ähnliche Genauigkeiten wie Radiologen erreicht. KI-basierte Lösungen wurden auch für die Bestimmung des Ursprungs von Skelettmetastasen (Lang et al., 2019) und die Klassifizierung von primären Knochentumoren (Do et al., 2017) entwickelt.
Abdomen und Becken
- 4% der kommerziell verfügbaren KI-basierten Anwendungen in der Radiologie (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021)..
Ein Großteil der Bemühungen um den Einsatz von KI in der abdominalen Bildgebung konzentrierte sich bisher auf die automatische Segmentierung von Organen wie Leber (Dou et al., 2017), Milz (Moon et al., 2019), Bauchspeicheldrüse (Oktay et al., 2018) und Nieren (Sharma et al., 2017). Darüber hinaus ergab eine systematische Überprüfung von 11 Studien, in denen Deep Learning für die Erkennung bösartiger Lebermassen eingesetzt wurde, Genauigkeiten von bis zu 97% und AUCs von bis zu 0,92 (Azer, 2019).
Andere Anwendungen von KI in der abdominalen Radiologie umfassen die Erkennung von Leberfibrose (He et al., 2019; Yasaka et al., 2018), Fettleber, hepatischem Eisengehalt, die Erkennung von freien Bauchgasen auf CT-Aufnahmen und die automatische Volumetrie und Segmentierung der Prostata (AI for Radiology, n.d.).
Hindernisse für die Implementierung
Trotz des großen Potenzials der künstlichen Intelligenz in der medizinischen Bildgebung hat sie sich in der klinischen Routinepraxis noch nicht durchgesetzt. Diese Umsetzung von der Forschung in die Klinik wird durch mehrere komplexe und miteinander verknüpfte Probleme behindert, die direkt oder indirekt die Wahrscheinlichkeit der Einführung von KI-basierten Lösungen verringern. Ein wichtiger Grund dafür ist das mangelnde Vertrauen wichtiger Interessengruppen wie Aufsichtsbehörden, Gesundheitsfachkräfte und Patienten in KI-basierte Lösungen (Cadario et al., 2021; Esmaeilzadeh, 2020; J. P. Richardson et al., 2021; Tucci et al., 2022).
Generalisierbarkeit
Eine große Herausforderung besteht darin, KI-basierte Lösungen zu entwickeln, die in neuen und realen Szenarien zuverlässig und gut funktionieren. In einer großen systematischen Übersichtsarbeit meldete fast die Hälfte der untersuchten KI-basierten Algorithmen für die medizinische Bildgebung einen Rückgang der AUC um mehr als 0,05, wenn sie mit neuen Daten getestet wurden (A. C. Yu et al., 2022). Diese mangelnde Generalisierbarkeit kann sich nachteilig auf die Leistung des Modells in einem realen Szenario auswirken.
Wenn eine Lösung schlecht abschneidet, wenn sie mit einem Datensatz getestet wird, der eine ähnliche oder identische Verteilung wie der Trainingsdatensatz aufweist, spricht man von einem Mangel an enger Generalisierbarkeit, der oft eine Folge von Überanpassung ist (Eche et al., 2021). Mögliche Lösungen für eine Überanpassung sind die Verwendung größerer Trainingsdatensätze und die Reduzierung der Komplexität des Modells. Wenn eine Lösung schlecht abschneidet, wenn sie mit einem Datensatz getestet wird, der eine andere Verteilung als der Trainingsdatensatz aufweist (z. B. eine andere Verteilung der ethnischen Zugehörigkeit der Patienten), spricht man von mangelnder breiter Generalisierbarkeit (Eche et al., 2021). Zu den Lösungen für eine schlechte breite Verallgemeinerbarkeit gehören Stresstests des Modells an Datensätzen mit einer anderen Verteilung als dem Trainingsdatensatz (Eche et al., 2021).
KI-Lösungen werden häufig in einem ressourcenintensiven Umfeld entwickelt, etwa in großen Technologieunternehmen und akademischen medizinischen Zentren in wohlhabenden Ländern. Es ist wahrscheinlich, dass sich die Ergebnisse und Leistungen in diesen ressourcenintensiven Kontexten nicht auf ressourcenärmere Kontexte wie kleinere Krankenhäuser, ländliche Gebiete oder ärmere Länder verallgemeinern lassen (Price & Nicholson, 2019), was das Problem weiter verkompliziert.
Verzerrungsrisiko
Bei KI-basierten Lösungen können Verzerrungen aufgrund von Daten oder menschlichen Faktoren auftreten. Ersteres ist der Fall, wenn die Daten, die zum Trainieren der KI-Lösung verwendet werden, die Zielpopulation nicht adäquat repräsentieren. Datensätze können nicht repräsentativ sein, wenn sie zu klein sind oder auf eine Weise erhoben wurden, die eine bestimmte Bevölkerungsgruppe falsch repräsentiert. KI-Lösungen, die auf nicht repräsentativen Daten trainiert werden, führen zu Verzerrungen und erbringen schlechte Leistungen in den Bevölkerungskategorien, die in den Trainingsdaten unterrepräsentiert oder falsch repräsentiert sind. Das Vorhandensein solcher Verzerrungen wurde in vielen KI-basierten Studien zur medizinischen Bildgebung empirisch nachgewiesen (Larrazabal et al., 2020; Seyyed-Kalantari et al., 2021). KI-basierte Lösungen sind anfällig für verschiedene subjektive und manchmal implizit oder explizit voreingenommene Entscheidungen während ihrer Entwicklung durch Menschen. Zu diesen menschlichen Faktoren gehören die Auswahl der Trainingsdaten, deren Kennzeichnung und die Entscheidung, sich auf das spezifische Problem zu konzentrieren, das die KI-basierte Lösung lösen soll (Norori et al., 2021). Es gibt einige Empfehlungen und Tools, die dazu beitragen, das Risiko von Verzerrungen in der KI-Forschung zu minimieren (AIF360: A Comprehensive Set of Fairness Metrics for Datasets and Machine Learning Models, Explanations for These Metrics, and Algorithms to Mitigate Bias in Datasets and Models, n.d., IBM Watson Studio - Model Risk Management, n.d.; Silberg & Manyika, 2019).
Menge, Qualität und Vielfalt der Daten
Probleme wie Verzerrungen und mangelnde Generalisierbarkeit lassen sich abmildern, indem sichergestellt wird, dass die Trainingsdaten in ausreichender Menge, Qualität und Vielfalt vorliegen. Dies ist jedoch schwierig zu bewerkstelligen, da die Patienten oft nicht bereit sind, ihre Daten für kommerzielle Zwecke zur Verfügung zu stellen (Aggarwal, Farag, et al., 2021; Ghafur et al., 2020; Trinidad et al., 2020), Krankenhäuser und Kliniken in der Regel nicht dafür ausgestattet sind, diese Daten in einer nutzbaren und sicheren Weise zur Verfügung zu stellen, und die Organisation und Kennzeichnung der Daten zeitaufwändig und teuer ist.
Viele Datensätze können für mehrere verschiedene Zwecke verwendet werden und der Austausch von Daten zwischen Unternehmen kann dabei helfen, den Prozess der Sammlung und Organisation von Daten effizienter zu gestalten und die Menge der für jeden Anwendungsbereich verfügbaren Daten zu vergrößern. Allerdings widerstrebt es Entwicklern häufig, Daten untereinander auszutauschen oder die genaue Herkunft ihrer Daten zu enthüllen, um wettbewerbsfähig zu bleiben.
Datenschutz und Privatsphäre
Die Entwicklung und Implementierung von KI-basierten Lösungen erfordert, dass Patienten ausdrücklich über die Verwendung ihrer Daten zu einem bestimmten Zweck und durch bestimmte Personen aufgeklärt werden und ihre Einwilligung dazu geben. Diese Daten müssen zudem angemessen vor Datenschutzverletzungen und Missbrauch geschützt werden. Kann dies nicht sichergestellt werden, erschüttert dies das öffentliche Vertrauen in KI-basierte Lösungen und behindert die Akzeptanz und Nutzung. Während Verordnungen zum Schutz von Gesundheitsdaten besagen, dass die Sammlung vollständig anonymisierter Daten keiner ausdrücklichen Einwilligung des Patienten bedarf (Datenschutzgrundverordnung (DSGVO) – offizieller Rechtstext, 2016; Office for Civil Rights (OCR), 2012) und die Daten theoretisch vor Missbrauch schützt, ist umstritten, ob Bilddaten vollständig anonymisiert werden können (Lotan et al., 2020; Murdoch, 2021). Auch ist fraglich, ob eine Einwilligungserklärung aufgrund der Komplexität der akquirierten Daten und unzähligen potenziellen Einsatzgebiete, die sich in Zukunft dafür ergeben könnten, überhaupt auf einer der Sache entsprechend ausreichend fundierten Entscheidung beruhen kann (Vayena & Blasimme, 2017).
IT-Infrastruktur
Unter den Krankenhausabteilungen gehört die Radiologie seit jeher zu denen, die sich an vorderster Front auf dem Gebiet der Digitalisierung bewegen. Für KI-basierte Lösungen, die sich auf die Bildverarbeitung und -auswertung konzentrieren, dürfte man in den meisten Radiologieabteilungen die erforderliche Infrastruktur vorfinden, etwa zur Verbindung bildgebender Geräte mit Computern für die Analyse und Archivierung der Aufnahmen und anderer Ausgabedaten. Allerdings dürfte in den meisten Radiologieabteilungen für andere Verwendungszwecke von KI (insbesondere solche, die die Integration von Informationen aus mehreren Quellen erfordern und mehrere komplexe Outputs aufweisen) eine umfangreiche Aktualisierung der IT-Infrastruktur vonnöten sein. Darüber hinaus gilt zu bedenken, dass die erforderliche Infrastruktur von Land zu Land sowie innerhalb der Länder sehr ungleich verteilt ist (Health Ethics & Governance, 2021).
Im Hinblick auf die Rechenleistung müssen Radiologieabteilungen entweder Ressourcen in die erforderliche Hardware und das Personal für den Betrieb dieser KI-basierten Lösungen investieren oder sich für cloudbasierte Lösungen entscheiden. Erstere sind mit zusätzlichen Kosten verbunden, ermöglichen allerdings die Datenverarbeitung innerhalb des lokalen Netzwerks eines Krankenhauses oder einer Klinik. Cloudbasierte Lösungen für die Datenverarbeitung (auch als „Infrastructure as a Service“ oder „IaaS“ bezeichnet) werden häufig als weniger sichere und vertrauenswürdige Option betrachtet; dies hängt allerdings von mehreren Faktoren ab und entspricht von daher nicht immer den Tatsachen (Baccianella & Gough, o. D.). Als Orientierungshilfe dafür, was bei der Beschaffung cloudbasierter Lösungen im Gesundheitswesen zu berücksichtigen ist, stehen Leitlinien zur Verfügung (Cloud Security for Healthcare Services, 2021).
Mangelnde Standardisierung, Kompatibilität und Integrierbarkeit
Die Infrastrukturproblematik wird umso komplizierter, wenn man berücksichtigt, wie fragmentiert der Markt für KI in der medizinischen Bildgebung derzeit ist (Alexander et al., 2020). Es ist daher wahrscheinlich, dass in naher Zukunft eine einzige Abteilung über Dutzende KI-basierter Lösungen von unterschiedlichen Anbietern verfügen wird, die gleichzeitig bzw. parallel laufen. Eine separate, geschlossene Infrastruktur (d. h. eine Workstation oder einen Server) für jede davon zu haben, wäre unglaublich kompliziert und schwierig zu verwalten. Vorgeschlagene Lösungen sind „Marktplätze“ für KI-Lösungen, die mit App-Stores vergleichbar sind (Advanced AI Solutions for Radiology, o. D., Curated Marketplace, 2018, Imaging AI Marketplace - Overview, o. D., Sectra Amplifier Marketplace, 2021, The Nuance AI Marketplace for Diagnostic Imaging, o. D.), sowie die Entwicklung einer übergreifenden, anbieterneutralen Infrastruktur (Leiner et al., 2021). Die erfolgreiche Implementierung solcher Lösungen erfordert, dass die Entwickler von KI-Lösungen Hand in Hand mit Bildgebungs- und Informationstechnikunternehmen zusammenarbeiten.
Interpretierbarkeit
Es ist oft unmöglich, genau zu verstehen, wie KI-basierte Lösungen zu ihren Schlussfolgerungen kommen, insbesondere bei komplexen Ansätzen wie Deep Learning. Dies verringert die Transparenz des Entscheidungsfindungsprozesses für die Beschaffung und Genehmigung dieser Lösungen, erschwert die Identifizierung von Verzerrungen und macht es für Kliniker schwieriger, ihren Patienten die Ergebnisse dieser Lösungen zu erklären und festzustellen, ob eine Lösung ordnungsgemäß funktioniert oder eine Fehlfunktion aufweist (Char et al., 2018; Reddy et al., 2020; Vayena et al., 2018; Whittlestone et al., 2019). Einige haben vorgeschlagen, dass Techniken, die Menschen dabei helfen zu verstehen, wie KI-basierte Algorithmen bestimmte Entscheidungen oder Vorhersagen getroffen haben („interpretierbare“ oder „erklärbare“ KI), dazu beitragen könnten, diese Herausforderungen zu bewältigen. Andere haben jedoch argumentiert, dass die derzeit verfügbaren Techniken ungeeignet sind, um einzelne Entscheidungen eines Algorithmus zu verstehen, und haben davor gewarnt, sich auf sie zu verlassen, um sicherzustellen, dass Algorithmen sicher und zuverlässig arbeiten (Ghassemi et al., 2021).
Haftung
In Gesundheitssystemen sorgt ein Haftungsmechanismus dafür, dass Gesundheitspersonal und medizinische Einrichtungen für negative Auswirkungen ihres Handelns zur Verantwortung gezogen werden können. Die Frage, wer für Fehler einer KI-basierten Lösung haften soll, ist kompliziert. In der Pharmazie liegt die Haftung für Produkten oder ihrer Verwendung innewohnende Fehler beispielsweise häufig entweder beim Hersteller oder der verschreibenden Person. Ein wichtiger Unterschied besteht darin, dass KI-basierte Systeme sich laufend weiterentwickeln und lernen. Aus diesem Grund funktionieren sie inhärent auf eine Weise, die unabhängig von allem ist, was ihre Entwickler vorhersagen konnten (Yeung, 2018). Für Endbenutzer wie Gesundheitspersonal kann eine KI-basierte Lösung undurchsichtig sein, sodass sie keinerlei Möglichkeit haben, zu erkennen, ob eine Lösung defekt oder ungenau ist (Habli et al., 2020; Yeung, 2018).
Zerbrechlichkeit (Brittleness)
Obwohl bei der Entwicklung von Deep-Learning-Algorithmen in den letzten Jahren große Fortschritte gemacht wurden, sind sie nach wie vor überraschend zerbrechlich. Dieses als „brittleness“ bezeichnete Phänomen bezeichnet den Umstand, dass ein Algorithmus in einem Szenario, das deutlich von dem abweicht, mit dem er trainiert wurde, nicht in der Lage ist, einen Kontext herzustellen und oft „bricht“, also unsinnige oder ungenaue Resultate produziert. Der Grund dafür ist, dass die meisten Algorithmen im Gegensatz zu Menschen Dinge innerhalb der Grenzen gewisser Annahmen wahrzunehmen lernen. Außerhalb dieser Grenze sind sie nicht zur Verallgemeinerung in der Lage. Ein Beispiel dafür, wie dieser Umstand in böswilliger Absicht ausgenutzt werden kann, ist die Tatsache, dass subtile Veränderungen an medizinischen Aufnahmen, die für Menschen nicht wahrnehmbar sind, die Resultate von Algorithmen zur Klassifizierung von Krankheiten fehlerhaft machen können (Finlayson et al., 2018). Der Mangel an Interpretierbarkeit vieler KI-basierter Lösungen verschärft dieses Problem zusätzlich, da es dadurch schwierig ist, herauszufinden, wie die Lösung zu dem falschen Ergebnis kam.
Kaufentscheidungen treffen
Bislang haben mehr als 100 KI-basierte Produkte ein CE-Kennzeichen (conformité européenne) oder eine Freigabe der US-Bundesbehörde zur Lebens- und Arzneimittel- Überwachung (FDA, Food and Drug Administration) erhalten. Diese Produkte sind in den von der FDA (Center for Devices & Radiological Health, o. D.), dem American College of Radiology (Assess-AI, o. D.) und sonstigen Stellen (AI for Radiology, o. D., The Medical Futurist, o. D.; E. Wu et al., 2021) kuratierten Datenbanken zu finden, die über Suchfunktionen verfügen und laufend aktualisiert werden. Die wachsende Anzahl verfügbarer Produkte, die inhärente Komplexität vieler dieser Lösungen und die Tatsache, dass viele Personen, die üblicherweise in Krankenhäusern Kaufentscheidungen treffen, mit der Beurteilung solcher Produkte nicht vertraut sind, machen eine genaue Erwägung, welches Produkt erworben werden soll, sehr wichtig. Solche Entscheidungen sollten erst nach Rücksprache mit Gesundheitspersonal, IT-Fachleuten sowie den Verwaltungs-, Finanz-, Rechts- und Personalabteilungen der Krankenhäuser getroffen werden.
Bei der Entscheidung, ob eine KI-basierte Lösung in der Radiologie angeschafft werden soll und welche der immer zahlreicher werdenden kommerziell verfügbaren Lösungen gekauft werden soll, müssen Überlegungen zu Qualität, Sicherheit und Finanzen angestellt werden. In den letzten Jahren sind mehrere Leitlinien entstanden, die potenziellen Käufern helfen sollen, diese Entscheidungen zu treffen (A Buyer‘s Guide to AI in Health and Care, 2020; Omoumi et al., 2021; Reddy et al., 2021), und diese Leitlinien werden sich in Zukunft wahrscheinlich mit den sich ändernden Erwartungen von Kunden, Aufsichtsbehörden und Interessengruppen, die an Erstattungsentscheidungen beteiligt sind, weiterentwickeln.
Zunächst einmal muss dem potenziellen Käufer klar sein, worin das Problem besteht und ob KI der geeignete Lösungsansatz ist oder ob es Alternativen gibt, die unterm Strich vorteilhafter sind. Wenn KI der geeignete Ansatz ist, sollten die Käufer genau wissen, welchen Lösungsumfang ein potenzielles KI-gestütztes Produkt hat - d. h. welches spezifische Problem die KI-gestützte Lösung lösen soll und unter welchen spezifischen Umständen. Dazu gehört, ob die Lösung für Screening, Diagnose, Überwachung, Behandlungsempfehlungen oder eine andere Anwendung gedacht ist. Dazu gehören auch die vorgesehenen Nutzer der Lösung und die Art der spezifischen Qualifikationen oder Ausbildung, die sie haben müssen, um die Lösung bedienen und ihre Ergebnisse interpretieren zu können. Den Käufern muss klar sein, ob die Lösung bestimmte Aufgaben ersetzen soll, die normalerweise vom Endbenutzer ausgeführt werden, ob sie als Double-Reader, als Triaging-Mechanismus oder für andere Aufgaben wie die Qualitätskontrolle dienen soll. Die Käufer sollten auch wissen, ob die Lösung „neue“ Informationen liefern soll (d. h. Informationen, die dem Benutzer ohne die Lösung nicht zur Verfügung stünden), ob sie die Leistung einer bestehenden Aufgabe über die Leistung eines Menschen oder einer anderen nicht KI-basierten Lösung hinaus verbessern soll oder ob sie Zeit oder andere Ressourcen sparen soll.
Die Käufer sollten zudem Zugang zu Informationen haben, die es ihnen ermöglichen, den potenziellen Nutzen der KI-Lösung zu beurteilen, und dies sollte durch veröffentlichte wissenschaftliche Belege für die Wirksamkeit und Kosteneffizienz der Lösung gestützt werden. Die Art und Weise, wie dies geschieht, hängt in hohem Maße von der Lösung selbst und dem Kontext ab, in dem sie eingesetzt werden soll, doch gibt es hierfür Richtlinien (National Institute for Health and Care Excellence (NICE), n.d.). Einige Fragen, die hier zu stellen sind, wären: Welchen Einfluss wird die Lösung auf das Patientenmanagement haben? Wird sie die diagnostische Leistung verbessern? Wird sie Zeit und Geld sparen? Wird sie sich auf die Lebensqualität der Patienten auswirken? Dem Käufer sollte auch klar sein, wer genau von der Nutzung dieser Lösung profitieren soll (Radiologen? Kliniker? Patienten? Das Gesundheitssystem oder die Gesellschaft als Ganzes?).
Wie bei jeder Maßnahme im Gesundheitswesen sind alle KI-basierten Lösungen mit potenziellen Risiken verbunden, die dem Käufer deutlich gemacht werden sollten. Einige dieser Risiken können rechtliche Konsequenzen haben, wie z. B. das Potenzial für Fehldiagnosen. Diese Risiken sollten quantifiziert werden, und potenzielle Käufer sollten einen Rahmen für den Umgang mit ihnen haben, einschließlich der Festlegung eines Rahmens für die Verantwortlichkeit innerhalb der Organisationen, die diese Lösungen implementieren. Die Käufer sollten auch sicherstellen, dass sie die potenziellen negativen Auswirkungen auf die Ausbildung der Radiologen und die potenzielle Störung der Arbeitsabläufe der Radiologen im Zusammenhang mit der Verwendung dieser Lösungen klar verstehen.
Bei der Entscheidung für oder gegen den Kauf einer KI-Lösung sind auch die spezifischen Merkmale des Konzepts von Bedeutung. Dazu gehört die Robustheit der Lösung gegenüber Unterschieden zwischen Anbietern und Scan-Parametern, die Umstände, unter denen der Algorithmus trainiert wurde (einschließlich möglicher Störfaktoren), und die Art und Weise, wie die Leistung bewertet wurde. Den Käufern sollte auch klar sein, ob und wie potenzielle Verzerrungsquellen bei der Entwicklung berücksichtigt wurden. Da ein wesentliches Merkmal von KI-basierten Lösungen darin besteht, dass sie kontinuierlich aus neuen Daten lernen können, sollte dem Käufer auch klar sein, ob und wie genau diese Umschulung mit der Zeit in die Lösung integriert wird, einschließlich der Frage, ob bei jeder Iteration eine neue behördliche Genehmigung erforderlich ist oder nicht. Dazu gehört auch, ob eine Umschulung erforderlich ist, wenn sich beispielsweise die bildgebenden Geräte in der Einrichtung des Käufers ändern.
Die Hauptargumente für viele KI-basierte Lösungen sind Benutzerfreundlichkeit und verbesserte Arbeitsabläufe. Daher sollten potenzielle Käufer sorgfältig prüfen, wie diese Lösungen in bestehende Arbeitsabläufe integriert werden sollen, einschließlich der Interoperabilität mit PACS und elektronischen Krankenakten. Ob die Lösung zusätzliche Hardware (z. B. grafische Verarbeitungseinheiten) oder Software (z. B. für die Visualisierung der Ergebnisse der Lösung) erfordert oder ob sie problemlos in die bestehende IT-Infrastruktur des Unternehmens des Käufers integriert werden kann, beeinflusst die Gesamtkosten der Lösung für den Käufer und ist daher ebenfalls eine wichtige Überlegung. Darüber hinaus sollte der Käufer wissen, wie viel manuelle Interaktion sowohl unter normalen Umständen als auch zur Fehlerbehebung erforderlich ist. Alle potenziellen Nutzer der KI-Lösung sollten in den Kaufprozess einbezogen werden, um sicherzustellen, dass sie mit der Lösung vertraut sind, dass sie ihren berufsethischen Standards entspricht und ihren Bedürfnissen gerecht wird.
Aus rechtlicher Sicht sollte dem Käufer klar sein, ob die Lösung die Vorschriften für Medizinprodukte und den Datenschutz erfüllt. Wurde die Lösung im Land des Käufers zugelassen? Wenn ja, unter welcher Risikoklassifizierung? Käufer sollten auch die Erstellung von Datenflusskarten in Erwägung ziehen, die zeigen, wie die Daten beim Betrieb der KI-basierten Lösung fließen, einschließlich der Frage, wer Zugriff auf die Daten hat.
Schließlich gibt es noch weitere Faktoren zu berücksichtigen, die nicht unbedingt nur für KI-basierte Lösungen gelten und mit denen die Käufer vielleicht schon vom Kauf anderer Lösungen vertraut sind. Dazu gehören das Lizenzierungsmodell der Lösung, die Art und Weise, wie die Benutzer in der Verwendung der Lösung geschult werden, wie die Lösung gewartet wird, wie mit Fehlern in der Lösung umgegangen wird und ob zusätzliche Kosten zu erwarten sind, wenn die Implementierung der Lösung skaliert wird (z. B. Verwendung der Lösung für mehr bildgebende Geräte oder mehr Benutzer). Auf diese Weise kann der potenzielle Käufer die aktuellen und künftigen Kosten für den Kauf der Lösung vorhersehen.
Künftige Trends
Das in den letzten zehn Jahren zunehmende Interesse an KI-basierten Lösungen für die medizinische Bildgebung und die damit verbundenen Fortschritte haben die Voraussetzungen für eine Reihe von Trends geschaffen, die sich in naher Zukunft wahrscheinlich noch verstärken werden.
Erstens setzt sich immer mehr die Ansicht durch, dass KI zwar vielversprechend für interpretierende Anwendungen ist (z. B. für die Erkennung von Pathologien), dass aber nicht-interpretierende KI-basierte Lösungen das größte Potenzial haben, wenn es darum geht, radiologische Arbeitsabläufe effizienter zu gestalten und die Patientenerfahrung zu verbessern. Dieser Trend, KI früher in den Patientenmanagementprozess einzubeziehen, wird sich wahrscheinlich darauf ausweiten, dass KI zunehmend als klinisches Entscheidungshilfesystem fungiert, um zu bestimmen, wann und welche Bildgebungsuntersuchungen durchgeführt werden.
Dazu muss die KI in die bestehenden klinischen Informationssystemen integriert werden, und die verwendeten Algorithmen müssen in der Lage sein, mehr unterschiedliche Daten zu verarbeiten. Dies wird wahrscheinlich den Weg für die Entwicklung von Algorithmen ebnen, die in der Lage sind, demografische, klinische und Labordaten von Patienten zu integrieren, um Empfehlungen zum Patientenmanagement zu geben (Huang, Pareek, et al., 2020; Rockenbach, 2021). Die bereits erwähnten Algorithmen zur Verarbeitung natürlicher Sprache, die zur Interpretation von Untersuchungsanfragen verwendet wurden, könnten hierfür nützliche Kandidaten sein.
Darüber hinaus werden wir wahrscheinlich KI-Algorithmen sehen, die mehrere verschiedene Arten von Bildgebungsdaten desselben Patienten interpretieren können. Derzeit arbeiten weniger als 5% der kommerziell verfügbaren KI-basierten Lösungen in der medizinischen Bildgebung mit mehr als einer Bildgebungsmodalität (Rezazade Mehrizi et al., 2021; van Leeuwen et al., 2021), obwohl der typische Patient in einem Krankenhaus während seines Aufenthalts mehrere Bildgebungsscans erhält (Shinagare et al., 2014). Damit ist es auch wahrscheinlich, dass mehr KI-basierte Lösungen entwickelt werden, die auf bisher vernachlässigte Modalitäten wie nukleare Bildgebungsverfahren und Ultraschall abzielen.
Der aktuelle Markt für KI-basierte Lösungen in der Radiologie ist auf eine relativ große Anzahl von Unternehmen verteilt (Alexander et al., 2020). Potenzielle Nutzer erwarten wahrscheinlich eine optimierte Integration dieser Produkte in ihre Arbeitsabläufe, was in einem derart fragmentierten Markt eine Herausforderung darstellen kann. Eine bessere Integration kann auf verschiedene Weise erreicht werden, u. a. durch anbieterneutrale Marktplätze oder durch die schrittweise Konsolidierung der Anbieter von KI-basierten Lösungen.
Mit dem zunehmenden Einsatz von KI wird die Frage des Vertrauens zwischen KI-Entwicklern, Angehörigen der Gesundheitsberufe, Regulierungsbehörden und Patienten an Bedeutung gewinnen. Es ist daher wahrscheinlich, dass die Bemühungen verstärkt werden, Schritte zur Stärkung dieses Vertrauens zu unternehmen. Dazu gehört möglicherweise die Anhebung der erwarteten Evidenzstandards für KI-gestützte Lösungen (Aggarwal, Sounderajah, et al., 2021; X. Liu et al., 2019; van Leeuwen et al., 2021; Yusuf et al, 2020), sie durch die Verwendung und Verbesserung interpretierbarer KI-Techniken transparenter zu machen (Holzinger et al., 2017; Reyes et al., 2020; „Towards Trustable Machine Learning“, 2018) und Techniken zur Wahrung des Datenschutzes von Patientendaten zu verbessern (G. Kaissis et al., 2021; G. A. Kaissis et al., 2020).
Darüber hinaus sehen die meisten bestehenden Vorschriften zwar vor, dass KI-basierte Algorithmen nach der Zertifizierung nicht mehr geändert werden dürfen, aber das wird sich in Zukunft wahrscheinlich ändern. Das Potenzial dieser Algorithmen, aus den nach der Zertifizierung gewonnenen Daten zu lernen und sich an veränderte Umstände anzupassen, ist ein großer Vorteil der KI. Allerdings fehlte es im Gesundheitssektor bisher an entsprechenden Rahmenbedingungen. In jüngster Zeit sind jedoch vielversprechende Ideen aufgetaucht, darunter die Anpassung bestehender Rahmenbedingungen für die Qualitätssicherung und -verbesserung in Krankenhäusern, um die Leistung KI-basierter Algorithmen und die Daten, auf denen sie trainiert wurden, zu überwachen und die Algorithmen entsprechend zu aktualisieren (Feng et al., 2022). Dies wird wahrscheinlich die Entwicklung multidisziplinärer Teams in Krankenhäusern erfordern, die aus Klinikern, IT-Fachleuten und Biostatistikern bestehen und eng mit Modellentwicklern und Regulierungsbehörden zusammenarbeiten (Feng et al., 2022).
Während die in den vorangegangenen Abschnitten erörterten Hindernisse die Einführung von KI in der Radiologie etwas verlangsamen könnten, dürfte die Befürchtung, dass KI möglicherweise Radiologen ersetzen könnte, kaum dazu gehören. Eine kürzlich durchgeführte Umfrage in Europa hat gezeigt, dass die meisten Radiologen nach der Einführung von KI-basierten Lösungen keine Verringerung ihrer klinischen Arbeitsbelastung wahrgenommen haben (European Society of Radiology (ESR), 2022), was wahrscheinlich darauf zurückzuführen ist, dass gleichzeitig die Nachfrage nach den Dienstleistungen von Radiologen kontinuierlich gestiegen ist. Studien aus der ganzen Welt haben gezeigt, dass Radiologen, insbesondere jene mit KI-Erfahrung, die Rolle der KI in ihrer Praxis generell optimistisch einschätzen (Y. Chen et al., 2021; Huisman et al., 2021; Ooi et al., 2021; Santomartino & Yi, 2022; Scott et al., 2021).
Fazit
KI hat sich als vielversprechend erwiesen, wenn es darum geht, praktisch jeden Aspekt der Arbeit einer radiologischen Abteilung positiv zu beeinflussen - von der Planung und Protokollierung von Patienten-Scans bis hin zur Interpretation von Bildern und der Erstellung von Diagnosen. Die vielversprechende Forschung zu KI-basierten Werkzeugen in der Radiologie wurde jedoch aufgrund einer Reihe komplexer, teilweise miteinander verflochtener Probleme noch nicht in großem Umfang in die Routinepraxis übernommen. Für viele dieser Herausforderungen gibt es potenzielle Lösungen, die jedoch noch weiter verfeinert und getestet werden müssen. In der Zwischenzeit entstehen Leitlinien, die potenziellen Nutzern von KI-basierten Lösungen in der Radiologie helfen sollen, sich in der wachsenden Zahl kommerzieller Produkte zurechtzufinden. Dies fördert ihre Anwendung in realen Szenarien und ermöglicht es, ihr wahres Potenzial zu entdecken sowie ihre Schwächen zu erkennen und auf sichere und effektive Weise zu beheben. Im Zuge dieser schrittweisen Verbesserungen werden diese Tools wahrscheinlich so weiterentwickelt, dass sie mehr unterschiedliche Daten verarbeiten können, in konsolidierte Arbeitsabläufe integriert werden, transparenter und letztlich nützlicher für die Steigerung der Effizienz und die Verbesserung der Patientenversorgung werden.
Referenzen
AAMC Report Reinforces Mounting Physician Shortage. (2021). AAMC. https://www.aamc.org/news-insights/press- releases/aamc-report-reinforces-mounting-physician-shortage
A buyer’s guide to AI in health and care. (2020). NHS Transformation Directorate. https://www.nhsx.nhs.uk/ai-lab/ explore-all-resources/adopt-ai/a-buyers-guide-to-ai-in-health- and-care/
Advanced AI solutions for radiology. (n.d.). Calantic Website. Retrieved July 3, 2022, from https://aivisions.calantic.com/
Aggarwal, R., Farag, S., Martin, G., Ashrafian, H., & Darzi, A. (2021). Patient Perceptions on Data Sharing and Applying Artificial Intelligence to Health Care Data: Cross-sectional Survey. Journal of Medical Internet Research, 23(8), e26162. https://doi.org/10.2196/26162
Aggarwal, R., Sounderajah, V., Martin, G., Ting, D. S. W., Karthikesalingam, A., King, D., Ashrafian, H., & Darzi, A. (2021). Diagnostic accuracy of deep learning in medical imaging: a systematic review and meta-analysis. NPJ Digital Medicine, 4(1), 65. https://doi.org/10.1038/s41746-021-00438-z
Agnes, S. A., Anitha, J., Pandian, S. I. A., & Peter, J. D. (2019). Classification of Mammogram Images Using Multiscale all Convolutional Neural Network (MA-CNN). Journal of Medical Systems, 44(1), 30. https://doi.org/10.1007/s10916-019-1494-z
AIF360: A comprehensive set of fairness metrics for datasets and machine learning models, explanations for these metrics, and algorithms to mitigate bias in datasets and models. (n.d.). Github. Retrieved June 11, 2022, from https:// github.com/Trusted-AI/AIF360
AI for radiology. (n.d.). Retrieved June 26, 2022, from https://grand-challenge.org/
aiforradiology/?subspeciality=Abdomen&modality=All&ce_ under=All&ce_class=All&fda_class=All&sort_by=last%20 modified&search=
Akagi, M., Nakamura, Y., Higaki, T., Narita, K., Honda, Y., Zhou, J., Yu, Z., Akino, N., & Awai, K. (2019). Deep learning reconstruction improves image quality of abdominal ultra- high-resolution CT. European Radiology, 29(11), 6163–6171. https://doi.org/10.1007/s00330-019-06170-3
Akkus, Z., Cai, J., Boonrod, A., Zeinoddini, A., Weston, A. D., Philbrick, K. A., & Erickson, B. J. (2019). A Survey of Deep- Learning Applications in Ultrasound: Artificial Intelligence- Powered Ultrasound for Improving Clinical Workflow. Journal of the American College of Radiology: JACR, 16(9 Pt B), 1318–1328. https://doi.org/10.1016/j.jacr.2019.06.004
Al-Antari, M. A., Al-Masni, M. A., & Kim, T.-S. (2020). Deep Learning Computer-Aided Diagnosis for Breast Lesion in Digital Mammogram. Advances in Experimental Medicine and Biology, 1213, 59–72. https://doi.org/10.1007/978-3-030-33128-3_4
Alexander, A., Jiang, A., Ferreira, C., & Zurkiya, D. (2020). An Intelligent Future for Medical Imaging: A Market Outlook on Artificial Intelligence for Medical Imaging. Journal of the American College of Radiology: JACR, 17(1 Pt B), 165–170. https:// doi.org/10.1016/j.jacr.2019.07.019
Allen, B., Agarwal, S., Coombs, L., Wald, C., & Dreyer, K. (2021). 2020 ACR Data Science Institute Artificial Intelligence Journal of the American College of Radiology: JACR
Alzubaidi, L., Zhang, J., Humaidi, A. J., Al-Dujaili, A., Duan, Y., Al-Shamma, O., Santamaría, J., Fadhel, M. A., Al-Amidie, M., & Farhan, L. (2021). Review of deep learning: concepts, CNN architectures, challenges, applications, future directions.
Arbabshirani, M. R., Fornwalt, B. K., Mongelluzzo, G. J., Suever, J. D., Geise, B. D., Patel, A. A., & Moore, G. J. (2018). Advanced machine learning in action: identification of intracranial hemorrhage on computed tomography scans of the head with clinical workflow integration. NPJ Digital Medicine, 1, 9. https://doi.org/10.1038/s41746-017-0015-z
Ardila, D., Kiraly, A. P., Bharadwaj, S., Choi, B., Reicher, J. J., Peng, L., Tse, D., Etemadi, M., Ye, W., Corrado, G., Naidich, D. P., & Shetty, S. (2019). End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography. Nature Medicine, 25(6), 954–961. https://doi. org/10.1038/s41591-019-0447-x
Arefan, D., Mohamed, A. A., Berg, W. A., Zuley, M. L., Sumkin, J. H., & Wu, S. (2020). Deep learning modeling using normal mammograms for predicting breast cancer risk. Medical Physics, 47(1), 110–118. https://doi.org/10.1002/mp.13886
Assess-AI. (n.d.). Retrieved July 2, 2022, from https://www. acrdsi.org/DSI-Services/Assess-AI
Azer, S. A. (2019). Deep learning with convolutional neural networks for identification of liver masses and hepatocellular carcinoma: A systematic review. World Journal of Gastrointestinal Oncology, 11(12), 1218–1230. https://doi.org/10.4251/wjgo.v11. i12.1218
Bacchi, S., Zerner, T., Oakden-Rayner, L., Kleinig, T., Patel, S., & Jannes, J. (2020). Deep Learning in the Prediction of Ischaemic Stroke Thrombolysis Functional Outcomes: A Pilot Study. Academic Radiology, 27(2), e19–e23. https://doi. org/10.1016/j.acra.2019.03.015
Baccianella, S., & Gough, T. (n.d.). Why cloud computing is the best option for hospitals adopting AI. Retrieved June 11, 2022, from https://www.aidence.com/articles/cloud-best-option- imaging-ai/
Balint, B. J., Steenburg, S. D., Lin, H., Shen, C., Steele, J. L., & Gunderman, R. B. (2014). Do telephone call interruptions have an impact on radiology resident diagnostic accuracy? Academic Radiology, 21(12), 1623–1628. https://doi.org/10.1016/j. acra.2014.08.001
Baltruschat, I., Steinmeister, L., Nickisch, H., Saalbach, A., Grass, M., Adam, G., Knopp, T., & Ittrich, H. (2021). Smart chest X-ray worklist prioritization using artificial intelligence: a clinical workflow simulation. European Radiology, 31(6), 3837– 3845. https://doi.org/10.1007/s00330-020-07480-7
Bash, S., Johnson, B., Gibbs, W., Zhang, T., Shankaranarayanan, A., & Tanenbaum, L. N. (2021). Deep Learning Image Processing Enables 40% Faster Spinal MR Scans Which Match or Exceed Quality of Standard of Care : A Prospective Multicenter Multireader Study. Clinical Neuroradiology. https://doi.org/10.1007/s00062-021-01121-2
Bash, S., Wang, L., Airriess, C., Zaharchuk, G., Gong, E., Shankaranarayanan, A., & Tanenbaum, L. N. (2021). Deep Learning Enables 60% Accelerated Volumetric Brain MRI While Preserving Quantitative Performance: A Prospective, Multicenter, Multireader Trial. AJNR. American Journal of Neuroradiology, 42(12), 2130–2137. https://doi.org/10.3174/ajnr.A7358
Boas, F. E., & Fleischmann, D. (2012). CT artifacts: causes and reduction techniques. Imaging in Medicine, 4(2), 229–240. https://doi.org/10.2217/iim.12.13
Boland, G. W., Duszak, R., Jr, & Kalra, M. (2014). Protocol design and optimization. Journal of the American College of Radiology: JACR, 11(5), 440–441. https://doi.org/10.1016/j. jacr.2014.01.021
Bonavita, I., Rafael-Palou, X., Ceresa, M., Piella, G., Ribas, V., & González Ballester, M. A. (2020). Integration of convolutional neural networks for pulmonary nodule malignancy assessment in a lung cancer classification pipeline. Computer Methods and Programs in Biomedicine, 185, 105172. https://doi.org/10.1016/j.cmpb.2019.105172
Bozkurt, S., Cahan, E. M., Seneviratne, M. G., Sun, R., Lossio- Ventura, J. A., Ioannidis, J. P. A., & Hernandez-Boussard, T. (2020). Reporting of demographic data and representativeness in machine learning models using electronic health records.
Journal of the American Medical Informatics Association: JAMIA, 27(12), 1878–1884. https://doi.org/10.1093/jamia/ocaa164
Brown, A. D., & Marotta, T. R. (2018). Using machine learning for sequence-level automated MRI protocol selection in neuroradiology. Journal of the American Medical Informatics Association: JAMIA, 25(5), 568–571. https://doi.org/10.1093/ jamia/ocx125
Bruls, R. J. M., & Kwee, R. M. (2020). Workload for radiologists during on-call hours: dramatic increase in the past 15 years.
Insights into Imaging, 11(1), 121. https://doi.org/10.1186/ s13244-020-00925-z
Buruk, B., Ekmekci, P. E., & Arda, B. (2020). A critical perspective on guidelines for responsible and trustworthy artificial intelligence. Medicine, Health Care, and Philosophy, 23(3), 387–399. https://doi.org/10.1007/s11019-020-09948-1
Cadario, R., Longoni, C., & Morewedge, C. K. (2021). Understanding, explaining, and utilizing medical artificial intelligence. Nature Human Behaviour, 5(12), 1636–1642. https://doi.org/10.1038/s41562-021-01146-0
Center for Devices, & Radiological Health. (n.d.). Artificial Intelligence and Machine Learning (AI/ML)-Enabled Medical Devices. U.S. Food and Drug Administration; FDA. Retrieved July 2, 2022, from https://www.fda.gov/medical-devices/software- medical-device-samd/artificial-intelligence-and-machine- learning-aiml-enabled-medical-devices
Char, D. S., Shah, N. H., & Magnus, D. (2018). Implementing Machine Learning in Health Care - Addressing Ethical Challenges. The New England Journal of Medicine, 378(11), 981–983. https://doi.org/10.1056/NEJMp1714229
Chen, H., Zhang, Y., Kalra, M. K., Lin, F., Chen, Y., Liao, P., Zhou, J., & Wang, G. (2017). Low-Dose CT With a Residual Encoder-Decoder Convolutional Neural Network. IEEE Transactions on Medical Imaging, 36(12), 2524–2535. https://doi.org/10.1109/TMI.2017.2715284
Chen, Y., Stavropoulou, C., Narasinkan, R., Baker, A., & Scarbrough, H. (2021). Professionals’ responses to the introduction of AI innovations in radiology and their implications for future adoption: a qualitative study. BMC Health Services Research, 21(1), 813. https://doi.org/10.1186/ s12913-021-06861-y
Choe, J., Lee, S. M., Do, K.-H., Lee, G., Lee, J.-G., Lee, S. M., & Seo, J. B. (2019). Deep Learning-based Image Conversion of CT Reconstruction Kernels Improves Radiomics Reproducibility for Pulmonary Nodules or Masses. Radiology, 292(2), 365–373. https://doi.org/10.1148/radiol.2019181960
Choi, K. S., Choi, S. H., & Jeong, B. (2019). Prediction of IDH genotype in gliomas with dynamic susceptibility contrast perfusion MR imaging using an explainable recurrent neural network. Neuro-Oncology, 21(9), 1197–1209. https://doi.org/10.1093/neuonc/noz095
Chong, L. R., Tsai, K. T., Lee, L. L., Foo, S. G., & Chang, P. C. (2020). Artificial Intelligence Predictive Analytics in the Management of Outpatient MRI Appointment No-Shows. AJR. American Journal of Roentgenology, 215(5), 1155–1162. https://doi.org/10.2214/AJR.19.22594
Cikes, M., Sanchez-Martinez, S., Claggett, B., Duchateau, N., Piella, G., Butakoff, C., Pouleur, A. C., Knappe, D., Biering- Sørensen, T., Kutyifa, V., Moss, A., Stein, K., Solomon, S. D., & Bijnens, B. (2019). Machine learning-based phenogrouping in heart failure to identify responders to cardiac resynchronization therapy. European Journal of Heart Failure, 21(1), 74–85. https://doi.org/10.1002/ejhf.1333
Ciompi, F., Chung, K., van Riel, S. J., Setio, A. A. A., Gerke, P. K., Jacobs, C., Scholten, E. T., Schaefer-Prokop, C., Wille,
M. M. W., Marchianò, A., Pastorino, U., Prokop, M., & van Ginneken, B. (2017). Towards automatic pulmonary nodule management in lung cancer screening with deep learning. Scientific Reports, 7, 46479. https://doi.org/10.1038/srep46479
Clinical radiology UK workforce census 2019 report. (2019). https://www.rcr.ac.uk/publication/clinical-radiology-uk- workforce-census-2019-report
Cloud security for healthcare services. (2021, January 14). ENISA. https://www.enisa.europa.eu/publications/cloud- security-for-healthcare-services/
CONSORT-AI and SPIRIT-AI Steering Group. (2019). Reporting guidelines for clinical trials evaluating artificial intelligence interventions are needed. Nature Medicine, 25(10), 1467–1468. https://doi.org/10.1038/s41591-019-0603-3
Curated marketplace. (2018, May 22). Blackford. https://www.blackfordanalysis.com/applications/
Dance, A. (2021). AI spots cell structures that humans can’t. Nature. 592 (7852), 154–155.
Dantas, L. F., Fleck, J. L., Cyrino Oliveira, F. L., & Hamacher, S. (2018). No-shows in appointment scheduling - a systematic literature review. Health Policy, 122(4), 412–421. https://doi.org/10.1016/j.healthpol.2018.02.002
Deák, Z., Grimm, J. M., Treitl, M., Geyer, L. L., Linsenmaier, U., Körner, M., Reiser, M. F., & Wirth, S. (2013). Filtered back projection, adaptive statistical iterative reconstruction, and a model-based iterative reconstruction in abdominal CT: an experimental clinical study. Radiology, 266(1), 197–206. https://doi.org/10.1148/radiol.12112707
Dembrower, K., Liu, Y., Azizpour, H., Eklund, M., Smith, K., Lindholm, P., & Strand, F. (2020). Comparison of a Deep
Learning Risk Score and Standard Mammographic Density Score for Breast Cancer Risk Prediction. Radiology, 294(2), 265–272. https://doi.org/10.1148/radiol.2019190872
Do, B. H., Langlotz, C., & Beaulieu, C. F. (2017). Bone Tumor Diagnosis Using a Naïve Bayesian Model of Demographic and Radiographic Features. Journal of Digital Imaging, 30(5), 640–647. https://doi.org/10.1007/s10278-017-0001-7
Dou, Q., Yu, L., Chen, H., Jin, Y., Yang, X., Qin, J., & Heng, P.-A. (2017). 3D deeply supervised network for automated segmentation of volumetric medical images. Medical Image Analysis, 41, 40–54. https://doi.org/10.1016/j. media.2017.05.001
Eche, T., Schwartz, L. H., Mokrane, F.-Z., & Dercle, L. (2021). Toward Generalizability in the Deployment of Artificial Intelligence in Radiology: Role of Computation Stress Testing to Overcome Underspecification. Radiology. Artificial Intelligence, 3(6), e210097. https://doi.org/10.1148/ryai.2021210097
England, N. H. S., & Improvement, N. H. S. (2019). NHS diagnostic waiting times and activity data. NHS. https://www. england.nhs.uk/statistics/wp-content/uploads/sites/2/2021/12/ DWTA-Report-October-2021_M43D4.pdf
Esmaeilzadeh, P. (2020). Use of AI-based tools for healthcare purposes: a survey study from consumers’ perspectives. BMC Medical Informatics and Decision Making, 20(1), 170. https://doi. org/10.1186/s12911-020-01191-1
Esses, S. J., Lu, X., Zhao, T., Shanbhogue, K., Dane, B., Bruno, M., & Chandarana, H. (2018). Automated image quality evaluation of T2 -weighted liver MRI utilizing deep learning architecture. Journal of Magnetic Resonance Imaging: JMRI, 47(3), 723–728. https://doi.org/10.1002/jmri.25779
European Society of Radiology (ESR). (2022). Current practical experience with artificial intelligence in clinical radiology:
a survey of the European Society of Radiology. Insights into Imaging, 13(1), 107. https://doi.org/10.1186/s13244-022- 01247-y
Faron, A., Sichtermann, T., Teichert, N., Luetkens, J. A., Keulers, A., Nikoubashman, O., Freiherr, J., Mpotsaris, A., & Wiesmann, M. (2020). Performance of a Deep-Learning Neural Network to Detect Intracranial Aneurysms from 3D TOF-MRA Compared to Human Readers. Clinical Neuroradiology, 30(3), 591–598. https://doi.org/10.1007/s00062-019-00809-w
Feng, J., Phillips, R. V., Malenica, I., Bishara, A., Hubbard, A. E., Celi, L. A., & Pirracchio, R. (2022). Clinical artificial intelligence quality improvement: towards continual monitoring and updating of AI algorithms in healthcare. NPJ Digital Medicine, 5(1), 66. https://doi.org/10.1038/s41746-022- 00611-y
Finlayson, S. G., Chung, H. W., Kohane, I. S., & Beam, A. L. (2018). Adversarial Attacks Against Medical Deep Learning Systems. In arXiv [cs.CR]. arXiv. https://doi.org/10.1145/nnnnnnn. nnnnnnn
Flanders, A. E., Prevedello, L. M., Shih, G., Halabi, S. S., Kalpathy-Cramer, J., Ball, R., Mongan, J. T., Stein, A., Kitamura, F. C., Lungren, M. P., Choudhary, G., Cala, L., Coelho, L., Mogensen, M., Morón, F., Miller, E., Ikuta, I., Zohrabian, V., McDonnell, O., … RSNA-ASNR 2019 Brain Hemorrhage CT Annotators. (2020). Construction of a Machine Learning Dataset through Collaboration: The RSNA 2019 Brain CT Hemorrhage Challenge. Radiology. Artificial Intelligence, 2(3), e190211. https://doi.org/10.1148/ryai.2020190211
Freeman, K., Geppert, J., Stinton, C., Todkill, D., Johnson, S., Clarke, A., & Taylor-Phillips, S. (2021). Use of artificial intelligence for image analysis in breast cancer screening programmes: systematic review of test accuracy. BMJ , 374, n1872. https://doi.org/10.1136/bmj.n1872
General Data Protection Regulation (GDPR) – Official Legal Text. (2016, July 13). General Data Protection Regulation (GDPR). https://gdpr-info.eu/
Ghafur, S., Van Dael, J., Leis, M., Darzi, A., & Sheikh, A. (2020). Public perceptions on data sharing: key insights from the UK and the USA. The Lancet. Digital Health, 2(9), e444–e446. https://doi.org/10.1016/S2589-7500(20)30161-8
Ghani, M. U., & Clem Karl, W. (2019). Fast Enhanced CT Metal Artifact Reduction using Data Domain Deep Learning. In arXiv [cs.CV]. arXiv. http://arxiv.org/abs/1904.04691
Ghassemi, M., Oakden-Rayner, L., & Beam, A. L. (2021). The false hope of current approaches to explainable artificial intelligence in health care. The Lancet. Digital Health, 3(11), e745–e750. https://doi.org/10.1016/S2589-7500(21)00208-9
Ginat, D. T. (2020). Analysis of head CT scans flagged by deep learning software for acute intracranial hemorrhage. Neuroradiology, 62(3), 335–340. https://doi.org/10.1007/ s00234-019-02330-w
Goebel, J., Stenzel, E., Guberina, N., Wanke, I., Koehrmann, M., Kleinschnitz, C., Umutlu, L., Forsting, M., Moenninghoff, C., & Radbruch, A. (2018). Automated ASPECT rating: comparison between the Frontier ASPECT Score software and the Brainomix software. Neuroradiology, 60(12), 1267–1272. https://doi.org/10.1007/s00234-018-2098-x
Habli, I., Lawton, T., & Porter, Z. (2020). Artificial intelligence in health care: accountability and safety. Bulletin of the World Health Organization, 98(4), 251–256. https://doi.org/10.2471/ BLT.19.237487
Halabi, S. S., Prevedello, L. M., Kalpathy-Cramer, J., Mamonov, A. B., Bilbily, A., Cicero, M., Pan, I., Pereira, L. A., Sousa, R. T., Abdala, N., Kitamura, F. C., Thodberg, H. H., Chen, L., Shih, G., Andriole, K., Kohli, M. D., Erickson, B. J., & Flanders, A. E. (2019). The RSNA Pediatric Bone Age Machine Learning Challenge. Radiology, 290(2), 498–503. https://doi. org/10.1148/radiol.2018180736
Hargreaves, B. A., Worters, P. W., Pauly, K. B., Pauly, J. M., Koch, K. M., & Gold, G. E. (2011). Metal-induced artifacts in MRI. AJR. American Journal of Roentgenology, 197(3), 547–555. https://doi.org/10.2214/AJR.11.7364
Harry, E., Sinsky, C., Dyrbye, L. N., Makowski, M. S., Trockel, M., Tutty, M., Carlasare, L. E., West, C. P., & Shanafelt, T. D. (2021). Physician Task Load and the Risk of Burnout Among US Physicians in a National Survey. Joint Commission Journal on Quality and Patient Safety / Joint Commission Resources, 47(2), 76–85. https://doi.org/10.1016/j.jcjq.2020.09.011
Hata, A., Yanagawa, M., Yamagata, K., Suzuki, Y., Kido, S., Kawata, A., Doi, S., Yoshida, Y., Miyata, T., Tsubamoto, M., Kikuchi, N., & Tomiyama, N. (2021). Deep learning algorithm for detection of aortic dissection on non-contrast-enhanced CT. European Radiology, 31(2), 1151–1159. https://doi.org/10.1007/ s00330-020-07213-w
Hauptmann, A., Arridge, S., Lucka, F., Muthurangu, V., & Steeden, J. A. (2019). Real-time cardiovascular MR with
spatio-temporal artifact suppression using deep learning-proof of concept in congenital heart disease. Magnetic Resonance in Medicine: Official Journal of the Society of Magnetic Resonance in Medicine / Society of Magnetic Resonance in Medicine, 81(2), 1143–1156. https://doi.org/10.1002/mrm.27480
Health Ethics & Governance. (2021, June 28). Ethics and governance of artificial intelligence for health. World Health Organization. https://www.who.int/publications/i/ item/9789240029200
He, L., Li, H., Dudley, J. A., Maloney, T. C., Brady, S. L., Somasundaram, E., Trout, A. T., & Dillman, J. R. (2019). Machine Learning Prediction of Liver Stiffness Using Clinical and T2-Weighted MRI Radiomic Data. AJR. American Journal of Roentgenology, 213(3), 592–601. https://doi.org/10.2214/ AJR.19.21082
Herent, P., Schmauch, B., Jehanno, P., Dehaene, O., Saillard, C., Balleyguier, C., Arfi-Rouche, J., & Jégou, S. (2019).
Detection and characterization of MRI breast lesions using deep learning. Diagnostic and Interventional Imaging, 100(4), 219–225. https://doi.org/10.1016/j.diii.2019.02.008
Hinton, B., Ma, L., Mahmoudzadeh, A. P., Malkov, S., Fan, B., Greenwood, H., Joe, B., Lee, V., Kerlikowske, K., & Shepherd,
J. (2019). Deep learning networks find unique mammographic differences in previous negative mammograms between interval and screen-detected cancers: a case-case study. Cancer Imaging: The Official Publication of the International Cancer Imaging Society, 19(1), 41. https://doi.org/10.1186/s40644-019-0227-3
Holzinger, A., Biemann, C., Pattichis, C. S., & Kell, D. B. (2017). What do we need to build explainable AI systems for the medical domain? In arXiv [cs.AI]. arXiv. http://arxiv.org/ abs/1712.09923
Hötker, A. M., Da Mutten, R., Tiessen, A., Konukoglu, E., & Donati, O. F. (2021). Improving workflow in prostate MRI:
AI-based decision-making on biparametric or multiparametric MRI. Insights into Imaging, 12(1), 112. https://doi.org/10.1186/ s13244-021-01058-7
Huang, S.-C., Kothari, T., Banerjee, I., Chute, C., Ball, R. L., Borus, N., Huang, A., Patel, B. N., Rajpurkar, P., Irvin, J., Dunnmon, J., Bledsoe, J., Shpanskaya, K., Dhaliwal, A., Zamanian, R., Ng, A. Y., & Lungren, M. P. (2020). PENet-a scalable deep-learning model for automated diagnosis of pulmonary embolism using volumetric CT imaging. NPJ Digital Medicine, 3, 61. https://doi.org/10.1038/s41746-020-0266-y
Huang, S.-C., Pareek, A., Seyyedi, S., Banerjee, I., & Lungren, M. P. (2020). Fusion of medical imaging and electronic health records using deep learning: a systematic review and implementation guidelines. NPJ Digital Medicine, 3, 136. https:// doi.org/10.1038/s41746-020-00341-z
Huisman, M., Ranschaert, E., Parker, W., Mastrodicasa, D., Koci, M., Pinto de Santos, D., Coppola, F., Morozov, S., Zins, M., Bohyn, C., Koç, U., Wu, J., Veean, S., Fleischmann, D., Leiner, T., & Willemink, M. J. (2021). An international survey on AI in radiology in 1,041 radiologists and radiology residents part 1: fear of replacement, knowledge, and attitude. European Radiology, 31(9), 7058–7066. https://doi.org/10.1007/s00330-021-07781-5
Hu, S.-Y., Santus, E., Forsyth, A. W., Malhotra, D., Haimson, J., Chatterjee, N. A., Kramer, D. B., Barzilay, R., Tulsky,
J. A., & Lindvall, C. (2019). Can machine learning improve patient selection for cardiac resynchronization therapy? PloS One, 14(10), e0222397. https://doi.org/10.1371/journal. pone.0222397
Hwang, E. J., Nam, J. G., Lim, W. H., Park, S. J., Jeong, Y. S., Kang, J. H., Hong, E. K., Kim, T. M., Goo, J. M., Park, S., Kim, K. H., & Park, C. M. (2019). Deep Learning for Chest Radiograph Diagnosis in the Emergency Department. Radiology, 293(3), 573–580. https://doi.org/10.1148/radiol.2019191225
Hwang, E. J., Park, S., Jin, K.-N., Kim, J. I., Choi, S. Y., Lee, J. H., Goo, J. M., Aum, J., Yim, J.-J., Park, C. M., & Deep Learning- Based Automatic Detection Algorithm Development and Evaluation Group. (2019). Development and Validation of a Deep Learning-based Automatic Detection Algorithm for Active Pulmonary Tuberculosis on Chest Radiographs. Clinical Infectious Diseases: An Official Publication of the Infectious Diseases Society of America, 69(5), 739–747. https://doi.org/10.1093/cid/ciy967
Hwang, S., Kim, H.-E., Jeong, J., & Kim, H.-J. (2016). A novel approach for tuberculosis screening based on deep convolutional neural networks. In G. D. Tourassi & S. G. Armato (Eds.), Medical Imaging 2016: Computer-Aided Diagnosis. SPIE. https://doi.org/10.1117/12.2216198
IBM Watson Studio - Model Risk Management. (n.d.). Retrieved June 11, 2022, from https://www.ibm.com/cloud/ watson-studio/model-risk-management
Imaging AI Marketplace - overview. (n.d.). Retrieved June 11, 2022, from https://www.ibm.com/products/imaging-ai- marketplace
Jamaludin, A., Lootus, M., Kadir, T., Zisserman, A., Urban, J., Battié, M. C., Fairbank, J., McCall, I., & Genodisc Consortium. (2017). ISSLS PRIZE IN BIOENGINEERING SCIENCE 2017:
Automation of reading of radiological features from magnetic resonance images (MRIs) of the lumbar spine without human intervention is comparable with an expert radiologist. European Spine Journal: Official Publication of the European Spine Society, the European Spinal Deformity Society, and the European Section of the Cervical Spine Research Society, 26(5), 1374–1383. https:// doi.org/10.1007/s00586-017-4956-3
Kaissis, G. A., Makowski, M. R., Rückert, D., & Braren, R. F. (2020). Secure, privacy-preserving and federated machine learning in medical imaging. Nature Machine Intelligence, 2(6), 305–311. https://doi.org/10.1038/s42256-020-0186-1
Kaissis, G., Ziller, A., Passerat-Palmbach, J., Ryffel, T., Usynin, D., Trask, A., Lima, I., Mancuso, J., Jungmann, F., Steinborn, M.-M., Saleh, A., Makowski, M., Rueckert, D., & Braren, R. (2021). End-to-end privacy preserving deep learning on multi-institutional medical imaging. Nature Machine Intelligence, 3(6), 473–484. https://doi.org/10.1038/s42256-021-00337-8
Kalra, A., Chakraborty, A., Fine, B., & Reicher, J. (2020). Machine Learning for Automation of Radiology Protocols for Quality and Efficiency Improvement. Journal of the American College of Radiology: JACR, 17(9), 1149–1158. https://doi.org/10.1016/j.jacr.2020.03.012
Kao, P.-Y., Chen, J. W., & Manjunath, B. S. (2019). Improving 3D U-Net for Brain Tumor Segmentation by Utilizing Lesion Prior. In arXiv [cs.CV]. arXiv. http://arxiv.org/abs/1907.00281
Kapoor, N., Lacson, R., & Khorasani, R. (2020). Workflow Applications of Artificial Intelligence in Radiology and an Overview of Available Tools. Journal of the American College of Radiology: JACR, 17(11), 1363–1370. https://doi.org/10.1016/j. jacr.2020.08.016
Kathirvelu, D., Vinupritha, P., & Kalpana, V. (2019). A computer aided diagnosis system for measurement of mandibular cortical thickness on dental panoramic radiographs in prediction of women with low bone mineral density. Journal of Medical Systems, 43(6), 148. https://doi.org/10.1007/s10916-019-1268-7
Ker, J., Singh, S. P., Bai, Y., Rao, J., Lim, T., & Wang, L. (2019). Image Thresholding Improves 3-Dimensional Convolutional Neural Network Diagnosis of Different Acute Brain Hemorrhages on Computed Tomography Scans. Sensors, 19(9). https://doi.org/10.3390/s19092167
Khan, F. A., Majidulla, A., Tavaziva, G., Nazish, A., Abidi, S. K., Benedetti, A., Menzies, D., Johnston, J. C., Khan, A. J., & Saeed, S. (2020). Chest x-ray analysis with deep learning- based software as a triage test for pulmonary tuberculosis: a prospective study of diagnostic accuracy for culture-confirmed disease. The Lancet. Digital Health, 2(11), e573–e581. https://doi.org/10.1016/S2589-7500(20)30221-1
Kim, D. W., Jang, H. Y., Kim, K. W., Shin, Y., & Park, S. H. (2019). Design Characteristics of Studies Reporting the Performance of Artificial Intelligence Algorithms for Diagnostic Analysis of Medical Images: Results from Recently Published Papers. Korean Journal of Radiology: Official Journal of the Korean Radiological Society, 20(3), 405–410. https://doi.org/10.3348/ kjr.2019.0025
Kim, K. H., & Park, S.-H. (2017). Artificial neural network for suppression of banding artifacts in balanced steady-state free precession MRI. Magnetic Resonance Imaging, 37, 139–146. https://doi.org/10.1016/j.mri.2016.11.020
Korteling, J. E. H., van de Boer-Visschedijk, G. C., Blankendaal, R. A. M., Boonekamp, R. C., & Eikelboom, A. R. (2021). Human- versus Artificial Intelligence. Frontiers in Artificial Intelligence 4, 622364. https://doi.org/10.3389/ frai.2021.622364
Kühl, N., Goutier, M., Baier, L., Wolff, C., & Martin, D. (2020). Human vs. supervised machine learning: Who learns patterns faster? In arXiv [cs.AI] arXiv. http://arxiv.org/abs/2012.03661
Kuo, W., Häne, C., Mukherjee, P., Malik, J., & Yuh, E. L. (2019). Expert-level detection of acute intracranial hemorrhage on head computed tomography using deep learning. Proceedings of the National Academy of Sciences of the United States of America, 116(45), 22737–22745. https://doi.org/10.1073/ pnas.1908021116
Langerhuizen, D. W. G., Janssen, S. J., Mallee, W. H., van den Bekerom, M. P. J., Ring, D., Kerkhoffs, G. M. M. J., Jaarsma,
R. L., & Doornberg, J. N. (2019). What Are the Applications and Limitations of Artificial Intelligence for Fracture Detection and Classification in Orthopaedic Trauma Imaging? A Systematic Review. Clinical Orthopaedics and Related Research, 477(11), 2482–2491. https://doi.org/10.1097/CORR.0000000000000848
Lang, N., Zhang, Y., Zhang, E., Zhang, J., Chow, D., Chang, P., Yu, H. J., Yuan, H., & Su, M.-Y. (2019). Differentiation of spinal metastases originated from lung and other cancers using radiomics and deep learning based on DCE-MRI. Magnetic Resonance Imaging, 64, 4–12. https://doi.org/10.1016/j. mri.2019.02.013
Larrazabal, A. J., Nieto, N., Peterson, V., Milone, D. H., & Ferrante, E. (2020). Gender imbalance in medical imaging datasets produces biased classifiers for computer-aided diagnosis. Proceedings of the National Academy of Sciences of the United States of America, 117(23), 12592–12594. https://doi.org/10.1073/pnas.1919012117
Lee, J.-S., Adhikari, S., Liu, L., Jeong, H.-G., Kim, H., & Yoon, S.-J. (2019). Osteoporosis detection in panoramic radiographs using a deep convolutional neural network-based computer- assisted diagnosis system: a preliminary study. Dento Maxillo Facial Radiology, 48(1), 20170344. https://doi.org/10.1259/ dmfr.20170344
Lee, Y. H. (2018). Efficiency Improvement in a Busy Radiology Practice: Determination of Musculoskeletal Magnetic Resonance Imaging Protocol Using Deep-Learning Convolutional Neural Networks. Journal of Digital Imaging, 31(5), 604–610. https://doi.org/10.1007/s10278-018-0066-y
Leiner, T., Bennink, E., Mol, C. P., Kuijf, H. J., & Veldhuis, W. B. (2021). Bringing AI to the clinic: blueprint for a vendor-neutral AI deployment infrastructure. Insights into Imaging, 12(1), 11. https://doi.org/10.1186/s13244-020-00931-1
Lekadir, K., Osuala, R., Gallin, C., Lazrak, N., Kushibar, K., Tsakou, G., Aussó, S., Alberich, L. C., Marias, K., Tsiknakis, M., Colantonio, S., Papanikolaou, N., Salahuddin, Z., Woodruff, H. C., Lambin, P., & Martí-Bonmatí, L. (2021). FUTURE-AI: Guiding Principles and Consensus Recommendations for Trustworthy Artificial Intelligence in Medical Imaging. In arXiv [cs.CV]. arXiv. http://arxiv.org/ abs/2109.09658
Letourneau-Guillon, L., Camirand, D., Guilbert, F., & Forghani, R. (2020). Artificial Intelligence Applications for Workflow, Process Optimization and Predictive Analytics. Neuroimaging Clinics of North America, 30(4), e1–e15. https://doi.org/10.1016/j.nic.2020.08.008
Levin, D. C., Parker, L., & Rao, V. M. (2017). Recent Trends in Imaging Use in Hospital Settings: Implications for Future Planning. Journal of the American College of Radiology: JACR, 14(3), 331–336. https://doi.org/10.1016/j.jacr.2016.08.025
Lindsey, R., Daluiski, A., Chopra, S., Lachapelle, A., Mozer, M., Sicular, S., Hanel, D., Gardner, M., Gupta, A., Hotchkiss, R., & Potter, H. (2018). Deep neural network improves fracture detection by clinicians. Proceedings of the National Academy of Sciences of the United States of America, 115(45), 11591–11596. https://doi.org/10.1073/pnas.1806905115
Liu, F., Tang, J., Ma, J., Wang, C., Ha, Q., Yu, Y., & Zhou, Z. (2021). The application of artificial intelligence to chest medical image analysis. Intelligent Medicine, 1(3), 104–117. https://doi.org/10.1016/j.imed.2021.06.004
Liu, F., Zhou, Z., Samsonov, A., Blankenbaker, D., Larison, W., Kanarek, A., Lian, K., Kambhampati, S., & Kijowski, R. (2018). Deep Learning Approach for Evaluating Knee MR Images: Achieving High Diagnostic Performance for Cartilage Lesion Detection. Radiology, 289(1), 160–169. https://doi.org/10.1148/ radiol.2018172986
Liu, X., Cruz Rivera, S., Moher, D., Calvert, M. J., Denniston, A. K., & SPIRIT-AI and CONSORT-AI Working Group. (2020). Reporting guidelines for clinical trial reports for interventions involving artificial intelligence: the CONSORT-AI extension. Nature Medicine, 26(9), 1364–1374. https://doi.org/10.1038/ s41591-020-1034-x
Liu, X., Faes, L., Kale, A. U., Wagner, S. K., Fu, D. J., Bruynseels, A., Mahendiran, T., Moraes, G., Shamdas, M., Kern, C., Ledsam, J. R., Schmid, M. K., Balaskas, K., Topol, E. J., Bachmann, L. M., Keane, P. A., & Denniston, A. K. (2019). A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging: a systematic review and meta-analysis. The Lancet. Digital Health, 1(6), e271–e297. https://doi.org/10.1016/S2589- 7500(19)30123-2
Li, X., Shen, L., Xie, X., Huang, S., Xie, Z., Hong, X., & Yu, J. (2020). Multi-resolution convolutional networks for chest X-ray radiograph based lung nodule detection. Artificial Intelligence in Medicine, 103, 101744. https://doi.org/10.1016/j. artmed.2019.101744
Lotan, E., Tschider, C., Sodickson, D. K., Caplan, A. L., Bruno, M., Zhang, B., & Lui, Y. W. (2020). Medical Imaging and Privacy in the Era of Artificial Intelligence: Myth, Fallacy, and the Future. Journal of the American College of Radiology: JACR, 17(9), 1159–1162. https://doi.org/10.1016/j.jacr.2020.04.007
Maegerlein, C., Fischer, J., Mönch, S., Berndt, M., Wunderlich, S., Seifert, C. L., Lehm, M., Boeckh-Behrens, T., Zimmer, C., & Friedrich, B. (2019). Automated Calculation of the Alberta Stroke Program Early CT Score: Feasibility and
Reliability. Radiology, 291(1), 141–148. https://doi.org/10.1148/ radiol.2019181228
Mairhöfer, D., Laufer, M., Simon, P. M., Sieren, M., Bischof, A., Käster, T., Barth, E., Barkhausen, J., & Martinetz, T. (2021). An AI-based Framework for Diagnostic Quality Assessment of Ankle Radiographs. https://openreview.net/ pdf?id=bj04hJss_xZ
Mancio, J., Pashakhanloo, F., El-Rewaidy, H., Jang, J., Joshi, G., Csecs, I., Ngo, L., Rowin, E., Manning, W., Maron, M., & Nezafat, R. (2022). Machine learning phenotyping of scarred myocardium from cine in hypertrophic cardiomyopathy. European Heart Journal Cardiovascular Imaging, 23(4), 532–542. https://doi.org/10.1093/ehjci/jeab056
Matsoukas, S., Morey, J., Lock, G., Chada, D., Shigematsu, T., Marayati, N. F., Delman, B. N., Doshi, A., Majidi, S.,
De Leacy, R., Kellner, C. P., & Fifi, J. T. (2022). AI software detection of large vessel occlusion stroke on CT angiography: a real-world prospective diagnostic test accuracy study. Journal of Neurointerventional Surgery. https://doi.org/10.1136/ neurintsurg-2021-018391
McKinney, S. M., Sieniek, M., Godbole, V., Godwin, J., Antropova, N., Ashrafian, H., Back, T., Chesus, M., Corrado, G. S., Darzi, A., Etemadi, M., Garcia-Vicente, F., Gilbert, F. J., Halling-Brown, M., Hassabis, D., Jansen, S., Karthikesalingam, A., Kelly, C. J., King, D., … Shetty, S. (2020). International evaluation of an AI system for breast cancer screening. Nature, 577(7788), 89–94. https://doi.org/10.1038/s41586-019-1799-6
McLeavy, C. M., Chunara, M. H., Gravell, R. J., Rauf, A., Cushnie, A., Staley Talbot, C., & Hawkins, R. M. (2021). The future of CT: deep learning reconstruction. Clinical Radiology, 76(6), 407–415. https://doi.org/10.1016/j.crad.2021.01.010
Medical AI evaluation. (n.d.). Retrieved June 26, 2022, from https://ericwu09.github.io/medical-ai-evaluation/
Mlynarski, P., Delingette, H., Criminisi, A., & Ayache, N. (2019). Deep learning with mixed supervision for brain tumor segmentation. Journal of Medical Imaging (Bellingham, Wash.), 6(3), 034002. https://doi.org/10.1117/1.JMI.6.3.034002
Mongan, J., Moy, L., & Kahn, C. E., Jr. (2020). Checklist for Artificial Intelligence in Medical Imaging (CLAIM): A Guide for Authors and Reviewers. Radiology. Artificial Intelligence, 2(2), e200029. https://doi.org/10.1148/ryai.2020200029
Moon, H., Huo, Y., Abramson, R. G., Peters, R. A., Assad, A., Moyo, T. K., Savona, M. R., & Landman, B. A. (2019). Acceleration of spleen segmentation with end-to-end deep learning method and automated pipeline. Computers in Biology and Medicine, 107, 109–117. https://doi.org/10.1016/j.compbiomed.2019.01.018
Morey, J. R., Zhang, X., Yaeger, K. A., Fiano, E., Marayati, N. F., Kellner, C. P., De Leacy, R. A., Doshi, A., Tuhrim, S., & Fifi, J. T. (2021). Real-World Experience with Artificial Intelligence- Based Triage in Transferred Large Vessel Occlusion Stroke Patients. Cerebrovascular Diseases, 50(4), 450–455. https://doi. org/10.1159/000515320
Murdoch, B. (2021). Privacy and artificial intelligence: challenges for protecting health information in a new era. BMC Medical Ethics, 22(1), 122. https://doi.org/10.1186/s12910-021-00687-3
Murray, N. M., Unberath, M., Hager, G. D., & Hui, F. K. (2020). Artificial intelligence to diagnose ischemic stroke and identify large vessel occlusions: a systematic review. Journal of Neurointerventional Surgery, 12(2), 156–164. https://doi.org/10.1136/neurintsurg-2019-015135
Nagendran, M., Chen, Y., Lovejoy, C. A., Gordon, A. C., Komorowski, M., Harvey, H., Topol, E. J., Ioannidis, J. P. A., Collins, G. S., & Maruthappu, M. (2020). Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies. BMJ, 368. https://doi.org/10.1136/bmj.m689
Nair, T., Precup, D., Arnold, D. L., & Arbel, T. (2020). Exploring uncertainty measures in deep networks for Multiple sclerosis lesion detection and segmentation. Medical Image Analysis, 59, 101557. https://doi.org/10.1016/j.media.2019.101557
Nakao, T., Hanaoka, S., Nomura, Y., Sato, I., Nemoto, M., Miki, S., Maeda, E., Yoshikawa, T., Hayashi, N., & Abe, O. (2018). Deep neural network-based computer-assisted detection of cerebral aneurysms in MR angiography. Journal of Magnetic Resonance Imaging: JMRI, 47(4), 948–953. https://doi.org/10.1002/jmri.25842
Nam, J. G., Kim, M., Park, J., Hwang, E. J., Lee, J. H., Hong, J. H., Goo, J. M., & Park, C. M. (2021). Development and validation of a deep learning algorithm detecting 10 common abnormalities on chest radiographs. The European Respiratory Journal: Official Journal of the European Society for Clinical Respiratory Physiology, 57(5). https://doi.org/10.1183/13993003.03061-2020
Narayana, P. A., Coronado, I., Sujit, S. J., Wolinsky, J. S., Lublin, F. D., & Gabr, R. E. (2020). Deep Learning for Predicting Enhancing Lesions in Multiple Sclerosis from Noncontrast. MRI. Radiology, 294(2), 398–404. https://doi.org/10.1148/ radiol.2019191061
National Institute for Health and Care Excellence (NICE). (n.d.). Evidence standards framework for digital health technologies. Retrieved June 10, 2022, from https://www.nice.org.uk/corporate/ecd7
Neisius, U., El-Rewaidy, H., Nakamori, S., Rodriguez, J., Manning, W. J., & Nezafat, R. (2019). Radiomic Analysis of Myocardial Native T1 Imaging Discriminates Between Hypertensive Heart Disease and Hypertrophic Cardiomyopathy. JACC. Cardiovascular Imaging, 12(10), 1946–1954. https://doi. org/10.1016/j.jcmg.2018.11.024
Nelson, A., Herron, D., Rees, G., & Nachev, P. (2019). Predicting scheduled hospital attendance with artificial intelligence. Npj Digital Medicine, 2(1), 26. https://doi.org/10.1038/s41746-019-0103-3
Nielsen, A., Hansen, M. B., Tietze, A., & Mouridsen, K. (2018). Prediction of Tissue Outcome and Assessment of Treatment Effect in Acute Ischemic Stroke Using Deep Learning. Stroke; a Journal of Cerebral Circulation, STROKEAHA.117.019740. https://doi.org/10.1161/STROKEAHA.117.019740
Norori, N., Hu, Q., Aellen, F. M., Faraci, F. D., & Tzovara, A. (2021). Addressing bias in big data and AI for health care: A call for open science. Patterns (New York, N.Y.), 2(10), 100347. https://doi.org/10.1016/j.patter.2021.100347
O’Connor, S. D., & Bhalla, M. (2021). Should Artificial Intelligence Tell Radiologists Which Study to Read Next? [Review of Should Artificial Intelligence Tell Radiologists Which Study to Read Next?]. Radiology. Artificial Intelligence, 3(2), e210009. https://doi.org/10.1148/ryai.2021210009
Office for Civil Rights (OCR). (2012, September 7). Guidance Regarding Methods for De-identification of Protected Health Information in Accordance with the Health Insurance Portability and Accountability Act (HIPAA) Privacy Rule. HHS.gov; US Department of Health and Human Services. https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de- identification/index.html
Oktay, O., Schlemper, J., Le Folgoc, L., Lee, M., Heinrich, M., Misawa, K., Mori, K., McDonagh, S., Hammerla, N. Y.,
Kainz, B., Glocker, B., & Rueckert, D. (2018). Attention U-Net: Learning Where to Look for the Pancreas. In arXiv [cs.CV]. arXiv. http://arxiv.org/abs/1804.03999
Olczak, J., Fahlberg, N., Maki, A., Razavian, A. S., Jilert, A., Stark, A., Sköldenberg, O., & Gordon, M. (2017). Artificial intelligence for analyzing orthopedic trauma radiographs. Acta Orthopaedica, 88(6), 581–586. https://doi.org/10.1080/1745367
4.2017.1344459
Olthof, A. W., van Ooijen, P. M. A., & Rezazade Mehrizi, M. H. (2020). Promises of artificial intelligence in neuroradiology: a systematic technographic review. Neuroradiology, 62(10), 1265–1278. https://doi.org/10.1007/s00234-020-02424-w
Omoumi, P., Ducarouge, A., Tournier, A., Harvey, H., Kahn, C. E., Jr, Louvet-de Verchère, F., Pinto Dos Santos, D., Kober, T., & Richiardi, J. (2021). To buy or not to buy-evaluating commercial AI solutions in radiology (the ECLAIR guidelines). European Radiology, 31(6), 3786–3796. https://doi.org/10.1007/ s00330-020-07684-x
O’Neill, T. J., Xi, Y., Stehel, E., Browning, T., Ng, Y. S., Baker, C., & Peshock, R. M. (2021). Active Reprioritization of the Reading Worklist Using Artificial Intelligence Has a Beneficial Effect on the Turnaround Time for Interpretation of Head CT with Intracranial Hemorrhage. Radiology. Artificial Intelligence, 3(2), e200024. https://doi.org/10.1148/ryai.2020200024
Ooi, S. K. G., Makmur, A., Soon, A. Y. Q., Fook-Chong, S., Liew, C., Sia, S. Y., Ting, Y. H., & Lim, C. Y. (2021). Attitudes toward artificial intelligence in radiology with learner needs assessment within radiology residency programmes: a national multi-programme survey. Singapore Medical Journal, 62(3), 126–134. https://doi.org/10.11622/smedj.2019141
Pan, Y., Shi, D., Wang, H., Chen, T., Cui, D., Cheng, X., & Lu, Y. (2020). Automatic opportunistic osteoporosis screening using low-dose chest computed tomography scans obtained for lung cancer screening. European Radiology, 30(7), 4107–4116. https://doi.org/10.1007/s00330-020-06679-y
Park, H. J., Kim, S. M., La Yun, B., Jang, M., Kim, B., Jang, J. Y., Lee, J. Y., & Lee, S. H. (2019). A computer-aided diagnosis system using artificial intelligence for the diagnosis and characterization of breast masses on ultrasound: Added value for the inexperienced breast radiologist. Medicine, 98(3), e14146. https://doi.org/10.1097/MD.0000000000014146
Price, I. I., & Nicholson, W. (2019). Medical AI and Contextual Bias. https://papers.ssrn.com/abstract=3347890
Puvanasunthararajah, S., Fontanarosa, D., Wille, M.-L., & Camps, S. M. (2021). The application of metal artifact reduction methods on computed tomography scans for radiotherapy applications: A literature review. Journal of Applied Clinical Medical Physics / American College of Medical Physics, 22(6), 198–223. https://doi.org/10.1002/acm2.13255
Qin, Z. Z., Sander, M. S., Rai, B., Titahong, C. N., Sudrungrot, S., Laah, S. N., Adhikari, L. M., Carter, E. J., Puri, L., Codlin, A. J., & Creswell, J. (2019). Using artificial intelligence to read chest radiographs for tuberculosis detection: A multi-site evaluation of the diagnostic accuracy of three deep learning systems. Scientific Reports, 9(1), 15000. https://doi.org/10.1038/ s41598-019-51503-3
Ramspek, C. L., Jager, K. J., Dekker, F. W., Zoccali, C., & van Diepen, M. (2021). External validation of prognostic models: what, why, how, when and where?
Rao, B., Zohrabian, V., Cedeno, P., Saha, A., Pahade, J., & Davis, M. A. (2021). Utility of Artificial Intelligence Tool as a Prospective Radiology Peer Reviewer - Detection of Unreported Intracranial Hemorrhage. Academic Radiology, 28(1), 85–93. https://doi.org/10.1016/j.acra.2020.01.035
Reddy, S., Allan, S., Coghlan, S., & Cooper, P. (2020). A governance model for the application of AI in health care. Journal of the American Medical Informatics Association: JAMIA, 27(3), 491–497. https://doi.org/10.1093/jamia/ocz192
Reddy, S., Rogers, W., Makinen, V.-P., Coiera, E., Brown, P., Wenzel, M., Weicken, E., Ansari, S., Mathur, P., Casey, A., & Kelly, B. (2021). Evaluation framework to guide implementation of AI systems into healthcare settings. BMJ Health & Care Informatics, 28(1). https://doi.org/10.1136/ bmjhci-2021-100444
Reyes, M., Meier, R., Pereira, S., Silva, C. A., Dahlweid, F.-M., von Tengg-Kobligk, H., Summers, R. M., & Wiest, R. (2020). On the Interpretability of Artificial Intelligence in Radiology: Challenges and Opportunities. Radiology. Artificial Intelligence, 2(3), e190043. https://doi.org/10.1148/ryai.2020190043
Rezazade Mehrizi, M. H., van Ooijen, P., & Homan, M. (2021). Applications of artificial intelligence (AI) in diagnostic radiology: a technography study. European Radiology, 31(4), 1805–1811. https://doi.org/10.1007/s00330-020-07230-9
Richardson, J. P., Smith, C., Curtis, S., Watson, S., Zhu, X., Barry, B., & Sharp, R. R. (2021). Patient apprehensions about the use of artificial intelligence in healthcare. NPJ Digital Medicine, 4(1), 140. https://doi.org/10.1038/s41746-021-00509-1
Richardson, M. L., Garwood, E. R., Lee, Y., Li, M. D., Lo, H. S., Nagaraju, A., Nguyen, X. V., Probyn, L., Rajiah, P., Sin, J., Wasnik, A. P., & Xu, K. (2021). Noninterpretive Uses of Artificial Intelligence in Radiology. Academic Radiology, 28(9), 1225– 1235. https://doi.org/10.1016/j.acra.2020.01.012
Rockenbach, M. A. B. (2021, June 13). Multimodal AI in healthcare: Closing the gaps. CodeX. https://medium.com/codex/ multimodal-ai-in-healthcare-1f5152e83be2
Rodríguez-Ruiz, A., Krupinski, E., Mordang, J.-J., Schilling, K., Heywang-Köbrunner, S. H., Sechopoulos, I., & Mann, R. M. (2019). Detection of Breast Cancer with Mammography: Effect of an Artificial Intelligence Support System. Radiology, 290(2), 305–314. https://doi.org/10.1148/radiol.2018181371
Rodriguez-Ruiz, A., Lång, K., Gubern-Merida, A., Broeders, M., Gennaro, G., Clauser, P., Helbich, T. H., Chevalier, M., Tan, T., Mertelmeier, T., Wallis, M. G., Andersson, I., Zackrisson, S., Mann, R. M., & Sechopoulos, I. (2019). Stand- Alone Artificial Intelligence for Breast Cancer Detection in Mammography: Comparison With 101 Radiologists. Journal of the National Cancer Institute, 111(9), 916–922. https://doi.org/10.1093/jnci/djy222
Santomartino, S. M., & Yi, P. H. (2022). Systematic Review of Radiologist and Medical Student Attitudes on the Role and Impact of AI in Radiology. Academic Radiology. https://doi.org/10.1016/j.acra.2021.12.032
Schemmel, A., Lee, M., Hanley, T., Pooler, B. D., Kennedy, T., Field, A., Wiegmann, D., & Yu, J.-P. J. (2016). Radiology Workflow Disruptors: A Detailed Analysis. Journal of the American College of Radiology: JACR, 13(10), 1210–1214. https://doi.org/10.1016/j.jacr.2016.04.009
Schreiber-Zinaman, J., & Rosenkrantz, A. B. (2017). Frequency and reasons for extra sequences in clinical abdominal MRI examinations. Abdominal Radiology (New York), 42(1), 306–311. https://doi.org/10.1007/s00261-016-0877-6
Scott, I. A., Carter, S. M., & Coiera, E. (2021). Exploring stakeholder attitudes towards AI in clinical practice. BMJ Health & Care Informatics, 28(1). https://doi.org/10.1136/ bmjhci-2021-100450
Seah, J. C. Y., Tang, C. H. M., Buchlak, Q. D., Holt, X. G., Wardman, J. B., Aimoldin, A., Esmaili, N., Ahmad, H., Pham, H., Lambert, J. F., Hachey, B., Hogg, S. J. F., Johnston, B. P., Bennett, C., Oakden-Rayner, L., Brotchie, P., & Jones, C. M. (2021). Effect of a comprehensive deep-learning model on the accuracy of chest x-ray interpretation by radiologists: a retrospective, multireader multicase study. The Lancet. Digital Health, 3(8), e496–e506. https://doi.org/10.1016/S2589- 7500(21)00106-0
Sectra Amplifier Marketplace. (2021, July 5). Sectra Medical. https://medical.sectra.com/product/sectra-amplifier- marketplace/
Sermesant, M., Delingette, H., Cochet, H., Jaïs, P., & Ayache, N. (2021). Applications of artificial intelligence in cardiovascular imaging. Nature Reviews. Cardiology, 18(8), 600–609. https://doi.org/10.1038/s41569-021-00527-2
Setio, A. A. A., Traverso, A., de Bel, T., Berens, M. S. N., van den Bogaard, C., Cerello, P., Chen, H., Dou, Q., Fantacci, M. E., Geurts, B., Gugten, R. van der, Heng, P. A., Jansen, B., de Kaste, M. M. J., Kotov, V., Lin, J. Y.-H., Manders, J. T. M. C., Sóñora-Mengana, A., García-Naranjo, J. C., … Jacobs, C. (2017). Validation, comparison, and combination of algorithms for automatic detection of pulmonary nodules in computed tomography images: The LUNA16 challenge. Medical Image Analysis, 42, 1–13. https://doi.org/10.1016/j.media.2017.06.015
Seyyed-Kalantari, L., Zhang, H., McDermott, M. B. A., Chen, I. Y., & Ghassemi, M. (2021). Underdiagnosis bias of artificial intelligence algorithms applied to chest radiographs in under- served patient populations. Nature Medicine, 27(12), 2176– 2182. https://doi.org/10.1038/s41591-021-01595-0
Shan, H., Padole, A., Homayounieh, F., Kruger, U., Khera, R. D., Nitiwarangkul, C., Kalra, M. K., & Wang, G. (2019). Competitive performance of a modularized deep neural network compared to commercial algorithms for low-dose CT image reconstruction. Nature Machine Intelligence, 1(6), 269–276. https://doi.org/10.1038/s42256-019-0057-9
Sharma, K., Rupprecht, C., Caroli, A., Aparicio, M. C., Remuzzi, A., Baust, M., & Navab, N. (2017). Automatic Segmentation of Kidneys using Deep Learning for Total Kidney Volume Quantification in Autosomal Dominant Polycystic Kidney Disease. Scientific Reports, 7(1), 2049. https://doi.org/10.1038/s41598-017-01779-0
Shelmerdine, S. C., Arthurs, O. J., Denniston, A., & Sebire, N. J. (2021). Review of study reporting guidelines for clinical studies using artificial intelligence in healthcare. BMJ Health & Care Informatics, 28(1). https://doi.org/10.1136/ bmjhci-2021-100385
Shinagare, A. B., Ip, I. K., Abbett, S. K., Hanson, R., Seltzer, S. E., & Khorasani, R. (2014). Inpatient imaging utilization: trends of the past decade. AJR. American Journal of Roentgenology, 202(3), W277–W283. https://doi.org/10.2214/AJR.13.10986
Shlobin, N. A., Baig, A. A., Waqas, M., Patel, T. R., Dossani, R. H., Wilson, M., Cappuzzo, J. M., Siddiqui, A. H., Tutino, V. M., & Levy, E. I. (2022). Artificial Intelligence for Large-Vessel Occlusion Stroke: A Systematic Review. World Neurosurgery, 159, 207–220.e1. https://doi.org/10.1016/j.wneu.2021.12.004
Silberg, J., & Manyika, J. (2019, June 6). Tackling bias in artificial intelligence (and in humans). McKinsey & Company. https://www.mckinsey.com/featured-insights/artificial- intelligence/tackling-bias-in-artificial-intelligence-and-in- humans
Singh, S., Kalra, M. K., Hsieh, J., Licato, P. E., Do, S., Pien, H. H., & Blake, M. A. (2010). Abdominal CT: comparison of adaptive statistical iterative and filtered back projection reconstruction techniques. Radiology, 257(2), 373–383. https://doi.org/10.1148/radiol.10092212
Smith-Bindman, R., Kwan, M. L., Marlow, E. C., Theis, M. K., Bolch, W., Cheng, S. Y., Bowles, E. J. A., Duncan, J. R.,
Greenlee, R. T., Kushi, L. H., Pole, J. D., Rahm, A. K., Stout, N. K., Weinmann, S., & Miglioretti, D. L. (2019). Trends in Use of Medical Imaging in US Health Care Systems and in Ontario, Canada, 2000-2016. JAMA: The Journal of the American Medical Association, 322(9), 843–856. https://doi.org/10.1001/ jama.2019.11456
Sutherland, G., Russell, N., Gibbard, R., & Dobrescu, A. (n.d.). The value of radiology, part II. https://car.ca/wp-content/ uploads/2019/07/value-of-radiology-part-2-en.pdf
Tamada, D., Kromrey, M.-L., Ichikawa, S., Onishi, H., & Motosugi, U. (2020). Motion Artifact Reduction Using a Convolutional Neural Network for Dynamic Contrast Enhanced MR Imaging of the Liver. Magnetic Resonance in Medical Sciences: MRMS: An Official Journal of Japan Society of Magnetic Resonance in Medicine, 19(1), 64–76. https://doi.org/10.2463/ mrms.mp.2018-0156
The Medical Futurist. (n.d.). The Medical Futurist. Retrieved February 23, 2022, from https://medicalfuturist.com/fda- approved-ai-based-algorithms/
The Nuance AI Marketplace for Diagnostic Imaging. (n.d.). https://www.nuance.com/content/dam/nuance/en_us/collateral/ healthcare/data-sheet/ds-ai-marketplace-for-diagnostic- imaging-en-us.pdf
Thodberg, H. H., Kreiborg, S., Juul, A., & Pedersen, K. D. (2009). The BoneXpert method for automated determination of skeletal maturity. IEEE Transactions on Medical Imaging, 28(1), 52–66. https://doi.org/10.1109/TMI.2008.926067
Thomas, K. A., Kidziński, Ł., Halilaj, E., Fleming, S. L., Venkataraman, G. R., Oei, E. H. G., Gold, G. E., & Delp, S. L. (2020). Automated Classification of Radiographic Knee Osteoarthritis Severity Using Deep Neural Networks. Radiology. Artificial Intelligence, 2(2), e190065. https://doi.org/10.1148/ ryai.2020190065
Towards trustable machine learning. (2018). Nature Biomedical Engineering, 2(10), 709–710. https://doi.org/10.1038/ s41551-018-0315-x
Trinidad, M. G., Platt, J., & Kardia, S. L. R. (2020). The public’s comfort with sharing health data with third-party commercial companies. Humanities and Social Sciences Communications, 7(1), 1–10. https://doi.org/10.1057/s41599-020-00641-5
Trivedi, H., Mesterhazy, J., Laguna, B., Vu, T., & Sohn, J. H. (2018). Automatic Determination of the Need for Intravenous Contrast in Musculoskeletal MRI Examinations Using IBM Watson’s Natural Language Processing Algorithm. Journal of Digital Imaging, 31(2), 245–251. https://doi.org/10.1007/ s10278-017-0021-3
Tsao, D. N. (2020, July 27). AI in medical diagnostics 2020- 2030: Image recognition, players, clinical applications, forecasts: IDTechEx. https://www.idtechex.com/en/research-report/ai-in- medical-diagnostics-2020-2030-image-recognition-players- clinical-applications-forecasts/766
Tucci, V., Saary, J., & Doyle, T. E. (2022). Factors influencing trust in medical artificial intelligence for healthcare professionals: a narrative review. Journal of Medical Artificial Intelligence, 5, 4–4. https://doi.org/10.21037/jmai-21-25
Ueda, D., Yamamoto, A., Nishimori, M., Shimono, T., Doishita, S., Shimazaki, A., Katayama, Y., Fukumoto, S., Choppin, A., Shimahara, Y., & Miki, Y. (2019). Deep Learning for MR Angiography: Automated Detection of Cerebral Aneurysms. Radiology, 290(1), 187–194. https://doi.org/10.1148/ radiol.2018180901
Urakawa, T., Tanaka, Y., Goto, S., Matsuzawa, H., Watanabe, K., & Endo, N. (2019). Detecting intertrochanteric hip fractures with orthopedist-level accuracy using a deep convolutional neural network. Skeletal Radiology, 48(2), 239–244. https://doi.org/10.1007/s00256-018-3016-3
van Leeuwen, K. G., Schalekamp, S., Rutten, M. J. C. M., van Ginneken, B., & de Rooij, M. (2021). Artificial intelligence in radiology: 100 commercially available products and their scientific evidence. European Radiology, 31(6), 3797–3804. https://doi.org/10.1007/s00330-021-07892-z
Vayena, E., & Blasimme, A. (2017). Biomedical Big Data: New Models of Control Over Access, Use and Governance. Journal of Bioethical Inquiry, 14(4), 501–513. https://doi.org/10.1007/ s11673-017-9809-6
Vayena, E., Blasimme, A., & Cohen, I. G. (2018). Machine learning in medicine: Addressing ethical challenges. PLoS Medicine, 15(11), e1002689. https://doi.org/10.1371/journal. pmed.1002689
Wang, J., Yang, F., Liu, W., Sun, J., Han, Y., Li, D., Gkoutos, G. V., Zhu, Y., & Chen, Y. (2020). Radiomic Analysis of Native T1 Mapping Images Discriminates Between MYH7 and MYBPC3- Related Hypertrophic Cardiomyopathy. Journal of Magnetic Resonance Imaging: JMRI, 52(6), 1714–1721. https://doi.org/10.1002/jmri.27209
Wang, S.-H., Tang, C., Sun, J., Yang, J., Huang, C., Phillips, P., & Zhang, Y.-D. (2018). Multiple Sclerosis Identification by 14-Layer Convolutional Neural Network With Batch Normalization, Dropout, and Stochastic Pooling. Frontiers in Neuroscience, 12, 818. https://doi.org/10.3389/fnins.2018.00818
Watanabe, A. T., Lim, V., Vu, H. X., Chim, R., Weise, E., Liu, J., Bradley, W. G., & Comstock, C. E. (2019). Improved
Cancer Detection Using Artificial Intelligence: a Retrospective Evaluation of Missed Cancers on Mammography. Journal
of Digital Imaging, 32(4), 625–637. https://doi.org/10.1007/ s10278-019-00192-5
Weikert, T., Francone, M., Abbara, S., Baessler, B., Choi, B. W., Gutberlet, M., Hecht, E. M., Loewe, C., Mousseaux, E., Natale, L., Nikolaou, K., Ordovas, K. G., Peebles, C., Prieto, C., Salgado, R., Velthuis, B., Vliegenthart, R., Bremerich, J., & Leiner, T. (2021). Machine learning in cardiovascular radiology: ESCR position statement on design requirements, quality assessment, current applications, opportunities, and challenges. European Radiology, 31(6), 3909–3922. https://doi.org/10.1007/ s00330-020-07417-0
Whittlestone, J., Nyrup, R., Alexandrova, A., Dihal, K., & Cave, S. (2019). Ethical and societal implications of algorithms, data, and artificial intelligence: a roadmap for research.
London: Nuffield Foundation. https://www.nuffieldfoundation. org/sites/default/files/files/Ethical-and-Societal-Implications-of- Data-and-AI-report-Nuffield-Foundat.pdf
WHO operational handbook on tuberculosis Module 2: Screening – Systematic screening for tuberculosis disease. (n.d.). Retrieved June 19, 2022, from https://www.who.int/ publications-detail-redirect/9789240022614
Willemink, M. J., & Noël, P. B. (2019). The evolution of image reconstruction for CT-from filtered back projection to artificial intelligence. European Radiology, 29(5), 2185–2195. https://doi.org/10.1007/s00330-018-5810-7
Winder, M., Owczarek, A. J., Chudek, J., Pilch-Kowalczyk, J., & Baron, J. (2021). Are We Overdoing It? Changes in Diagnostic Imaging Workload during the Years 2010-2020 including the Impact of the SARS-CoV-2 Pandemic. Healthcare (Basel, Switzerland), 9(11). https://doi.org/10.3390/healthcare9111557
Wong, T. T., Kazam, J. K., & Rasiej, M. J. (2019). Effect of Analytics-Driven Worklists on Musculoskeletal MRI
Interpretation Times in an Academic Setting. AJR. American Journal of Roentgenology, 1–5. https://doi.org/10.2214/ AJR.18.20434
Wu, B., Zhou, Z., Wang, J., & Wang, Y. (2018). Joint learning for pulmonary nodule segmentation, attributes and malignancy prediction. 2018 IEEE 15th International Symposium on Biomedical Imaging (ISBI 2018), 1109–1113. https://doi.org/10.1109/ISBI.2018.8363765
Wu, E., Wu, K., Daneshjou, R., Ouyang, D., Ho, D. E., & Zou, J. (2021). How medical AI devices are evaluated: limitations and recommendations from an analysis of FDA approvals. Nature Medicine, 27(4), 582–584. https://doi.org/10.1038/s41591-021-01312-x
Wu, G.-G., Zhou, L.-Q., Xu, J.-W., Wang, J.-Y., Wei, Q., Deng, Y.-B., Cui, X.-W., & Dietrich, C. F. (2019). Artificial intelligence in breast ultrasound. World Journal of Radiology, 11(2), 19–26. https://doi.org/10.4329/wjr.v11.i2.19
Yala, A., Schuster, T., Miles, R., Barzilay, R., & Lehman, C. (2019). A Deep Learning Model to Triage Screening Mammograms: A Simulation Study. Radiology, 293(1), 38–46. https://doi.org/10.1148/radiol.2019182908
Yasaka, K., Akai, H., Kunimatsu, A., Abe, O., & Kiryu, S. (2018). Liver Fibrosis: Deep Convolutional Neural Network for Staging by Using Gadoxetic Acid-enhanced Hepatobiliary Phase MR Images. Radiology, 287(1), 146–155. https://doi.org/10.1148/ radiol.2017171928
Yeung, K. (2018). A Study of the Implications of Advanced Digital Technologies (Including AI Systems) for the Concept of
Responsibility Within a Human Rights Framework. https://papers. ssrn.com/abstract=3286027
Yoo, Y., Tang, L. Y. W., Li, D. K. B., Metz, L., Kolind, S., Traboulsee, A. L., & Tam, R. C. (2019). Deep learning of brain lesion patterns and user-defined clinical and MRI features for predicting conversion to multiple sclerosis from clinically isolated syndrome. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, 7(3), 250–259. https://doi.org/10.1080/21681163.2017.1356750
Yu, A. C., Mohajer, B., & Eng, J. (2022). External Validation of Deep Learning Algorithms for Radiologic Diagnosis: A Systematic Review. Radiology. Artificial Intelligence, 4(3), e210064. https://doi.org/10.1148/ryai.210064
Yu, J.-P. J., Kansagra, A. P., & Mongan, J. (2014). The radiologist’s workflow environment: evaluation of disruptors and potential implications. Journal of the American College of Radiology: JACR, 11(6), 589–593. https://doi.org/10.1016/j. jacr.2013.12.026
Yusuf, M., Atal, I., Li, J., Smith, P., Ravaud, P., Fergie, M., Callaghan, M., & Selfe, J. (2020). Reporting quality of studies using machine learning models for medical diagnosis: a systematic review. BMJ Open, 10(3), e034568. https://doi.org/10.1136/bmjopen-2019-034568
Yu, Y., Xie, Y., Thamm, T., Gong, E., Ouyang, J., Christensen, S., Marks, M. P., Lansberg, M. G., Albers, G. W., & Zaharchuk,
G. (2021). Tissue at Risk and Ischemic Core Estimation Using Deep Learning in Acute Stroke. AJNR. American Journal of Neuroradiology, 42(6), 1030–1037. https://doi.org/10.3174/ajnr. A7081
Yu, Y., Xie, Y., Thamm, T., Gong, E., Ouyang, J., Huang, C., Christensen, S., Marks, M. P., Lansberg, M. G., Albers, G. W., & Zaharchuk, G. (2020). Use of Deep Learning to Predict Final Ischemic Stroke Lesions From Initial Magnetic Resonance Imaging. JAMA Network Open, 3(3), e200772. https://doi.org/10.1001/jamanetworkopen.2020.0772
Zhang, Y., & Yu, H. (2018). Convolutional Neural Network Based Metal Artifact Reduction in X-Ray Computed Tomography. IEEE Transactions on Medical Imaging, 37(6), 1370–1381. https://doi.org/10.1109/TMI.2018.2823083
Zhao, B., Liu, Z., Ding, S., Liu, G., Cao, C., & Wu, H. (2022). Motion artifact correction for MR images based on convolutional neural network. Optoelectronics Letters, 18(1), 54–58. https://doi.org/10.1007/s11801-022-1084-z
Zhao, J., Huang, Y., Song, Y., Xie, D., Hu, M., Qiu, H., & Chu, J. (2020). Diagnostic accuracy and potential covariates for machine learning to identify IDH mutations in glioma patients: evidence from a meta-analysis. European Radiology, 30(8), 4664–4674. https://doi.org/10.1007/s00330-020-06717-9
Zhou, C., Ding, C., Wang, X., Lu, Z., & Tao, D. (2020). One-pass Multi-task Networks with Cross-task Guided Attention for Brain Tumor Segmentation. IEEE Transactions on Image Processing: A Publication of the IEEE Signal Processing Society. https://doi.org/10.1109/TIP.2020.2973510
Zicari, R. V., Brodersen, J., Brusseau, J., Düdder, B., Eichhorn, T., Ivanov, T., Kararigas, G., Kringen, P., McCullough, M., Möslein, F., Mushtaq, N., Roig, G., Stürtz, N., Tolle, K., Tithi, J. J., van Halem, I., & Westerlund, M. (2021). Z-Inspection®: A Process to Assess Trustworthy AI. IEEE Transactions on Technology and Society, 1–1. https://doi.org/10.1109/TTS.2021.3066209