Mit Schwimmflügeln in die KI-Welle eintauchen

Tools für künstliche Intelligenz. Ein Überblick

Künstliche Intelligenz (KI) ist längst in unserem Alltag angekommen. Die Technologien überholen sich allerdings regelmäßig selbst, wodurch ständig neue Tools auf den Markt kommen. Um die Übersicht über die aktuellen Möglichkeiten zu behalten, zeigt dieser Artikel einen Überblick über einige KI-Anwendungen, die aktuell im Trend sind.

Sich ständig neue Fertigkeiten und Tools anzueignen, gehört in der digitalen Welt zum Alltag, kostet allerdings auch viel Zeit. Hat man das eine Programm verstanden, gibt es schon wieder ein neues, vermeintlich besseres. Oft scheint es, dass man mehr Zeit damit verbringt, Programme zu vergleichen und zu erkunden, als dass man letzlich wirklich damit arbeitet. Die KI-Welle ist hier besonders schnell auf uns eingeflutet, deshalb möchte ich den Versuch, mir einen Überblick über die aktuellen KI-Tools zu verschaffen, mit euch teilen.

Was steckt hinter künstlicher Intelligenz? #

KI gibt es eigentlich schon sehr lange, so wurde der Begriff bereits in den 1950er Jahren geprägt. In den letzten zwei Jahrzehnten hat sich die KI-Forschung jedoch besonders schnell weiterentwickelt und ist integraler Bestandteil vieler Technologien und Anwendungen in Bereichen wie dem Gesundheits- & Finanzwesen oder im Verkehr geworden. Insbesondere aufgrund technischer Fortschritte, wie besseren und kostengünstigeren Rechenleistungen, konnte der Zugang zu künstlichen Intelligenzen nun auch für “normale” Entwickler:innen und Anwender:innen ermöglicht werden. So poppt derzeit eine Anwendung nach der nächsten hervor. Einerseits weil alle die Chance auf ein neues Produkt ergreifen wollen, andererseits, weil KI in vielen Bereichen einsetzbar ist beziehungsweise Potenzial zum Einsatz zeigt. Vor wenigen Wochen wurde dazu nun auch eine “KI-Verordnung” als fundamentaler Grundstein für den Einsatz und die Regulierung von künstlicher Intelligenz in der EU festgelegt.  

Obwohl es möglich ist, seine KI selbst zu erstellen und zu trainieren, fehlen dem/der Durchschnittsdeveloper:in die Ressourcen dafür (z.B. Datenmengen). So unterliegen viele der neuen Produkte meist denselben KI-Modellen, welche im Hintergrund die entscheidende Arbeit leisten. Diese werden von bekannten Unternehmen wie Google, Microsoft, IBM, AWS oder auch OpenAI, Stability AI und Nvidia kostenpflichtig und teilweise als Open-Source-Projekt (kostenfrei) zur Verfügung gestellt. Entwickler:innen können über eine API auf jene Modelle zugreifen und sie für ihre eigene Anwendung oder Softwarelösung nützen. 

Die Modelle werden auch als neuronale Netzwerke bezeichnet und sind ein wenig mit einem Gehirn zu vergleichen. Sie unterscheiden sich in ihrer Architektur, den Trainingsmethoden und -daten, ihrer Leistungsfähigkeit und eignen sich dadurch für verschiedene Anwendungsgebiete wie Textanalyse, Textgenerierung, Übersetzung oder auch Bilderkennung und Bildgenerierung.

Beispiele für KI-Modelle #

Ich habe ChatGPT 3.5 um ein paar Beispiele der leistungsstärksten Modelle gebeten. Das sind die Ergebnisse für unterschiedliche Bereiche im KI-Kontext:

NLP (Natürliche Sprachverarbeitung) #

  • GPT-3 (Generative Pre-trained Transformer 3): Entwickelt von OpenAI, ist GPT-3 eines der größten bekannten Sprachmodelle mit 175 Milliarden Parametern. Es hat beeindruckende Fähigkeiten in der Textgenerierung und natürlichen Sprachverarbeitung.
  • BERT (Bidirectional Encoder Representations from Transformers): Ein leistungsstarkes Sprachmodell von Google, das für eine Vielzahl von natürlichsprachlichen Aufgaben verwendet wird und beeindruckende Ergebnisse erzielt hat.

Computer Vision #

  • EfficientNet: Ein leistungsstarkes Modell für die Bildklassifizierung, das durch die Kombination von Effizienz und Genauigkeit beeindruckt.
  • ResNet (Residual Neural Network): Eine weit verbreitete Architektur für tiefe neuronale Netzwerke, die für Bildklassifizierung, Objekterkennung und Segmentierung verwendet wird.

Reinforcement Learning #

  • AlphaGo Zero und AlphaZero: Beide von DeepMind entwickelt, haben AlphaGo Zero und AlphaZero bahnbrechende Leistungen in den Bereichen Schach, Go und Shogi gezeigt.
  • DQN (Deep Q-Network): Ein Modell für das Deep Reinforcement Learning, das für die Lösung von Problemen in Umgebungen mit diskreter Aktion und Zustandsraum verwendet wird.

Generative Modelle #

  • StyleGAN und StyleGAN2: Entwickelt von Nvidia, ermöglichen diese Modelle die Generierung von hochauflösenden, qualitativ hochwertigen Bildern und haben Anwendungen in der Kunst und Fotografie.
  • DALL-E: Ein Modell für die Bildgenerierung, das von OpenAI entwickelt wurde und auf Textbeschreibungen reagiert, um kreative und vielfältige Bilder zu generieren.

KI-Tools zum Stöbern #

Für alle, die noch nicht das passende Tool gefunden haben, gibt es hier noch eine kleine Auflistung von Tools zur Übersicht, auf die ich im Zuge meiner Recherche gestoßen bin. Unbeachtet dabei altbewährte Anwendungen, die sich natürlich auch ihre KI-Funktionalitäten mit ins Boot holen (z.B. Photoshop, Illustrator, Figma, Canva etc).

Image Generation #

Webdesign #

Text Generation #

Code Generation #

Text to Video #

Text to Motion #

3D #

Motion Capture #

Dabei ist zu beachten, dass fast alle dieser Anwendungen bei intensiver Nutzung kostenpflichtig werden. Im Bereich der Bildgenerierung bietet sich Stable Diffusion als kostenfreie Alternative an. Mit Stable Diffusion können Bilder auf dem eigenen PC erstellt werden. Designer:innen wie ich benötigen dazu eine GUI (eine grafische Benutzeroberfläche), um die Anwendung bedienen zu können. Hierfür gibt es wiederum verschiedene Lösungen wie Automativ1111, SD Next, IvokeAI, ComfyUI, DiffusionBee oder Foooocus.

Die Version von ChatGPT 3.5. zur Generierung von Texten kann man auch kostenfrei nutzen und als vielversprechenden Code-Generator scheint sich aktuell Devin AI herauszukristallisieren.

Ausblick #

KI-Tools entwickeln sich laufend weiter und es lohnt sich, am Laufenden zu bleiben und sich immer wieder mit neuen Anwendungen auseinanderzusetzen. In Bezug auf UI/UX Design stellen sich mir nun Fragen wie, welchen Nutzen eine Integration von KI für individuelle Softwarelösungen oder gegebenenfalls auch Webseiten mit sich bringen kann? Welche neuen Produkte können dabei entstehen? Und wie können bestehende Anwendungen mithilfe von KI unterstützt und verbessert werden? Hier ist es wichtig, immer am Ball zu bleiben, damit gute Innovationen auch effizient eingesetzt werden können.

Dazu gehört auch, laufend neue Anwendungen zu erkunden und sinnvoll in den eigenen Workflow zu integrieren. Hier können insbesondere Bild-, Text und gegebenenfalls auch Codegenerierung sehr nützlich werden. Auch gibt es Lösungen, die einem das UI Design übernehmen wollen.

Neben dem Überblick über KI-Tools in diesem Artikel findet ihr unter den folgenden Webseiten weitere Sammlungen von unzähligen KI-Anwendungen unter verschiedensten Kategorisierungen:

Zuletzt noch eine Empfehlung, um regelmäßig am Laufenden über künstliche Intelligenz zu bleiben. Einen (von sicher vielen guten) Newsletter zum Thema findet ihr hier: The Neuron

veröffentlicht am