Το Midjourney είναι ένα πρόγραμμα και υπηρεσία παραγωγής τεχνητής νοημοσύνης που δημιουργήθηκε και φιλοξενείται από το ανεξάρτητο ερευνητικό εργαστήριο Midjourney, Inc. με έδρα το Σαν Φρανσίσκο. Το Midjourney δημιουργεί εικόνες από περιγραφές φυσικής γλώσσας, που ονομάζονται "προτροπές", παρόμοιες με το DALL-E και το Stable Diffusion του OpenAI.[1][2]
Το εργαλείο βρίσκεται αυτήν τη στιγμή σε ανοιχτή beta, στην οποία εισήχθη στις 12 Ιουλίου 2022.[3] Η ομάδα Midjourney διευθύνεται από τον Ντέιβιντ Χολτς, ο οποίος ίδρυσε την Leap Motion.[4] Ο Holz είπε στο The Register τον Αύγουστο του 2022 ότι η εταιρεία ήταν ήδη κερδοφόρα.[5] Οι χρήστες δημιουργούν έργα τέχνης με το Midjourney χρησιμοποιώντας εντολές στο Discord bot.[6]
Η Midjourney, Inc. ιδρύθηκε στο Σαν Φρανσίσκο της Καλιφόρνια από τον Ντέιβιντ Χολτς,[7] προηγουμένως συνιδρυτή της Leap Motion.[8] Η πλατφόρμα δημιουργίας εικόνας Midjourney εισήλθε για πρώτη φορά σε ανοιχτή beta στις 12 Ιουλίου 2022.[3] Ωστόσο, στις 14 Μαρτίου 2022, ο διακομιστής Discord ξεκίνησε με αίτημα να δημοσιεύονται φωτογραφίες υψηλής ποιότητας στο Twitter/Reddit για εκπαίδευση του συστήματος.
Η εταιρεία εργάζεται για τη βελτίωση των αλγορίθμων της, κυκλοφορώντας νέες εκδόσεις μοντέλων κάθε λίγους μήνες. Η έκδοση 2 του αλγορίθμου τους κυκλοφόρησε τον Απρίλιο του 2022[9] και η έκδοση 3 στις 25 Ιουλίου[9] Στις 5 Νοεμβρίου 2022, η επανάληψη άλφα της έκδοσης 4 κυκλοφόρησε στους χρήστες[10][11] και στις 15 Μαρτίου 2023, κυκλοφόρησε η επανάληψη άλφα της έκδοσης 5.[12] Το μοντέλο 5.1 έχει μεγαλύτερη «άποψη» από την έκδοση 5, εφαρμόζοντας περισσότερο το δικό του στυλιζάρισμα στις εικόνες, ενώ το μοντέλο 5.1 RAW προσθέτει βελτίωση ενώ λειτουργεί καλύτερα με περισσότερες κυριολεκτικές προτροπές.
|
Το Midjourney είναι προς το παρόν προσβάσιμο μόνο μέσω ενός bot Discord στον επίσημο διακομιστή του Discord, μέσω απευθείας μηνυμάτων στο bot ή προσκαλώντας το bot σε διακομιστή τρίτου μέρους. Για τη δημιουργία εικόνων, οι χρήστες χρησιμοποιούν την εντολή /imagine
και πληκτρολογούν μια προτροπή. Στη συνέχεια, το bot επιστρέφει ένα σύνολο τεσσάρων εικόνων. Στη συνέχεια, οι χρήστες μπορούν να επιλέξουν ποιες εικόνες θέλουν να αναβαθμίσουν. Το Midjourney εργάζεται επίσης σε μια διεπαφή ιστού.
Ο ιδρυτής Ντέιβιντ Χολτς λέει ότι βλέπει τους καλλιτέχνες ως πελάτες και όχι ως ανταγωνιστές του Midjourney. Ο Χολτς είπε στο The Register ότι οι καλλιτέχνες χρησιμοποιούν το Midjourney για γρήγορη δημιουργία πρωτοτύπων καλλιτεχνικών ιδεών για να δείξουν στους πελάτες πριν ξεκινήσουν οι ίδιοι τη δουλειά.[5] Μερικοί καλλιτέχνες έχουν κατηγορήσει το Midjourney ότι απαξιώνει το πρωτότυπο δημιουργικό έργο χρησιμοποιώντας το στο σετ εκπαίδευσης.[20] Οι όροι παροχής υπηρεσιών του Midjourney περιλαμβάνουν μια πολιτική κατάργησης DMCA, η οποία επιτρέπει στους καλλιτέχνες να ζητούν την αφαίρεση του έργου τους από το σετ, εάν πιστεύουν ότι είναι εμφανής η παραβίαση πνευματικών δικαιωμάτων.[21]
Ο κλάδος της διαφήμισης δεν άργησε να αγκαλιάσει εργαλεία τεχνητής νοημοσύνης όπως το Midjourney, το DALL-E και το Stable Diffusion, μεταξύ άλλων. Τα εργαλεία, τα οποία επιτρέπουν στους διαφημιστές να δημιουργούν πρωτότυπο περιεχόμενο και να συλλέγουν ιδέες γρήγορα, παρέχουν νέες ευκαιρίες όπως "προσαρμοσμένες διαφημίσεις που δημιουργούνται για ιδιώτες, έναν νέο τρόπο δημιουργίας ειδικών εφέ ή ακόμη και να κάνουν τη διαφήμιση ηλεκτρονικού εμπορίου πιο αποτελεσματική", σύμφωνα με το Ad Age.[22]
Το πρόγραμμα χρησιμοποιήθηκε από το βρετανικό περιοδικό The Economist για να δημιουργήσει το εξώφυλλο ενός τεύχους τον Ιούνιο του 2022.[24][25] Στην Ιταλία, η κορυφαία εφημερίδα Corriere della Sera δημοσίευσε ένα κόμικ που δημιουργήθηκε με το Midjourney από τον συγγραφέα Vanni Santoni τον Αύγουστο του 2022[26] Ο Charlie Warzel χρησιμοποίησε το Midjourney για να δημιουργήσει δύο εικόνες του Άλεξ Τζόουνς για το ενημερωτικό δελτίο του Warzel στο The Atlantic. Η χρήση ενός εξωφύλλου που δημιουργήθηκε από AI επικρίθηκε από ανθρώπους που θεώρησαν ότι έπαιρνε δουλειές από καλλιτέχνες. Ο Warzel χαρακτήρισε τη δράση του «λάθος» σε ένα άρθρο σχετικά με την απόφασή του να χρησιμοποιήσει δημιουργημένες εικόνες.[27] Το Last Week Tonight with John Oliver περιελάμβανε ένα τμήμα 10 λεπτών στο Midjourney σε ένα επεισόδιο που μεταδόθηκε τον Αύγουστο του 2022.[28][29]
Μια εικόνα Midjourney που ονομάζεται Théâtre d'Opéra Spatial κέρδισε την πρώτη θέση στον διαγωνισμό ψηφιακής τέχνης στην Κρατική Έκθεση του Κολοράντο 2022. Ο Τζέισον Άλλεν, ο οποίος έγραψε την προτροπή που οδήγησε το Midjourney να δημιουργήσει την εικόνα, εκτύπωσε την εικόνα σε έναν καμβά και τη συμμετείχε στον διαγωνισμό χρησιμοποιώντας το όνομα "Jason M. Allen via Midjourney". Άλλοι ψηφιακοί καλλιτέχνες αναστατώθηκαν από τα νέα.[20] Ο Άλλεν δεν απολογήθηκε, επιμένοντας ότι ακολουθούσε τους κανόνες του διαγωνισμού. Οι κριτές των δύο κατηγοριών δεν γνώριζαν ότι το Midjourney χρησιμοποιούσε τεχνητή νοημοσύνη για τη δημιουργία εικόνων, αν και αργότερα είπαν ότι αν το γνώριζαν αυτό, θα είχαν απονείμει ούτως ή άλλως στον Άλλεν το κορυφαίο βραβείο.[30]
Τον Δεκέμβριο του 2022, το Midjourney χρησιμοποιήθηκε για τη δημιουργία των εικόνων σε ένα παιδικό βιβλίο που δημιουργήθηκε από AI σε διάστημα ενός Σαββατοκύριακου. Με τίτλο Alice and Sparkle, το βιβλίο παρουσιάζει ένα νεαρό κορίτσι που κατασκευάζει ένα ρομπότ που αποκτά αυτογνωσία. Ο δημιουργός, Ammaar Reeshi, πέρασε ώρες προσαρμόζοντας τις προτροπές του Midjourney, απορρίπτοντας εκατοντάδες αποτελέσματα που δημιουργήθηκαν για να επιλέξει τελικά 13 εικονογραφήσεις για το βιβλίο.[31] Τόσο το προϊόν όσο και η διαδικασία προκάλεσαν κριτική: «το κύριο πρόβλημα... είναι ότι εκπαιδεύτηκε από τη δουλειά των καλλιτεχνών. Είναι οι δημιουργίες μας, τα ξεχωριστά στυλ μας που δημιουργήσαμε, που δεν συναινέσαμε να χρησιμοποιηθούν», έγραψε ένας καλλιτέχνης.[32]
Το 2023, ο ρεαλισμός των παραγωγών κειμένου σε εικόνα που βασίζονται σε τεχνητή νοημοσύνη, όπως το Midjourney, το DALL-E ή το Stable Diffusion,[33][34] έφτασε σε τόσο υψηλό επίπεδο που οδήγησε σε ένα σημαντικό κύμα ιογενούς AI-δημιουργημένες φωτογραφίες. Μεγάλη προσοχή κέρδισε μια φωτογραφία του Πάπα Φραγκίσκου που δημιουργήθηκε από το Midjourney φορώντας λευκό παλτό,[35][36] η φανταστική σύλληψη του Ντόναλντ Τραμπ,[37] και μια φάρσα για επίθεση στο Πεντάγωνο,[38] επίσης ως χρήση στις επαγγελματικές δημιουργικές τέχνες.[39][40]
Πριν από τον Μάιο του 2023, το Midjourney εφάρμοσε έναν μηχανισμό εποπτείας που βασιζόταν σε ένα σύστημα "απαγορευμένων λέξεων". Αυτή η μέθοδος απαγόρευε τη χρήση γλώσσας που σχετίζεται με ρητό περιεχόμενο, όπως σεξουαλικά ή πορνογραφικά θέματα, καθώς και ακραία βία. Επιπλέον, το σύστημα απαγόρευσε επίσης ορισμένες μεμονωμένες λέξεις, συμπεριλαμβανομένων θρησκευτικών και πολιτικών προσωπικοτήτων όπως «Αλλάχ» ή «Σι Τζινπίνγκ». Αυτή η πρακτική προκαλούσε περιστασιακά διαμάχες λόγω των αντιληπτών περιπτώσεων λογοκρισίας στην πλατφόρμα του midjourney.[41]
Ξεκινώντας τον Μάιο του 2023, με επακόλουθες ενημερώσεις μετά την έκδοση 5, το Midjourney πέρασε σε ένα σύστημα εποπτείας περιεχομένου "τροφοδοτούμενο από AI". Αυτός ο προηγμένος μηχανισμός επέτρεψε μια πιο λεπτή ερμηνεία των προτροπών των χρηστών αναλύοντάς τα στο σύνολό τους. Κατά συνέπεια, διευκόλυνε την εξαρτώμενη από το πλαίσιο χρήση λέξεων που είχαν προηγουμένως απαγορευτεί. Για παράδειγμα, οι χρήστες μπορούν τώρα να ζητήσουν από το AI να δημιουργήσει ένα πορτρέτο του "Xi Jinping". Ωστόσο, το σύστημα θα αποτρέψει τη δημιουργία αμφιλεγόμενων εικόνων, όπως απεικονίσεις παγκόσμιων ηγετών, συμπεριλαμβανομένου του Σι Τζινπίνγκ, σε καταστάσεις σύλληψης.[42]
Στις 13 Ιανουαρίου 2023 τρεις καλλιτέχνες – Sarah Andersen, Kelly McKernan και Karla Ortiz – κατέθεσε αγωγή για παραβίαση πνευματικών δικαιωμάτων κατά των Stability AI, Midjourney και DeviantArt, υποστηρίζοντας ότι αυτές οι εταιρείες έχουν παραβιάσει τα δικαιώματα εκατομμυρίων καλλιτεχνών, εκπαιδεύοντας εργαλεία τεχνητής νοημοσύνης σε πέντε δισεκατομμύρια εικόνες που έχουν αφαιρεθεί από τον Ιστό, χωρίς τη συγκατάθεση των αρχικών καλλιτεχνών.[43]
Η νομική αγωγή ξεκίνησε στο Σαν Φρανσίσκο από τον δικηγόρο Matthew Butterick σε συνεργασία με τη δικηγορική εταιρεία Joseph Saveri, την ίδια ομάδα που αμφισβητεί τη Microsoft, το GitHub και το OpenAI (προγραμματιστή των ChatGPT και DALL-E 2) στο δικαστήριο.
Το Midjourney έχει τρία επίπεδα συνδρομής.[44] Προηγουμένως πρόσφεραν μια δωρεάν δοκιμή, αλλά απέσυραν αυτήν την υπηρεσία επικαλούμενη υψηλή ζήτηση και κακή χρήση.
Όταν η δωρεάν δοκιμή ήταν διαθέσιμη, η δημιουργία μιας εικόνας την ενεργοποίησε. Οι δοκιμαστικοί χρήστες θα μπορούσαν να κάνουν περίπου 25 εργασίας πριν χρειαστεί να εγγραφούν για να συνεχίσουν να το χρησιμοποιούν.[45]
Η τιμολόγηση του Midjourney AI είναι διαθέσιμη, το Midjourney κοστίζει από 10 έως 60$ ανά μήνα, ανάλογα με το πλάνο. Υπάρχει επίσης μια δωρεάν δοκιμή που είναι καλή για 25 γενιές εικόνων.[46]
|title=
(βοήθεια); Missing or empty |user= (help); Missing or empty |number= (help); Missing or empty |date= (help)