Διεθνή

Φρένο στην αλόγιστη χρήση AI λόγω κόστους από Microsoft και Uber

Προσθήκη ως αγαπημένη πηγή στην Google
Financialreport.gr

Οι εταιρείες περιορίζουν τα εργαλεία κώδικα καθώς η έκρηξη στην κατανάλωση tokens εκτοξεύει τους λογαριασμούς

Η Microsoft ξεκίνησε να ακυρώνει τις περισσότερες άμεσες άδειες Claude Code, μεταφέροντας μηχανικούς στο GitHub Copilot CLI, σύμφωνα με το The Verge.

Η απόφαση έρχεται έξι μήνες αφότου έδωσε πρόσβαση στο Claude Code, ενθαρρύνοντας χιλιάδες προγραμματιστές, product managers, σχεδιαστές και άλλα στελέχη της να πειραματιστούν με δημιουργία κώδικα μέσω του εργαλείου. Η ταχεία διάδοση της χρήσης του οδήγησε τελικά σε αλλαγή πορείας σε μια τεχνολογία που οι ίδιοι οι μηχανικοί είχαν αρχίσει να θεωρούν απαραίτητη.

Η ακύρωση των αδειών δεν επηρεάζει τη συμφωνία επιπέδου Foundry με την Anthropic. Σύμφωνα με το The Verge, η συμφωνία περιλαμβάνει επένδυση έως 5 δισ. δολάρια στην Anthropic και πρόσβαση των πελατών Foundry στα μοντέλα Claude, ενώ η Anthropic έχει δεσμευτεί για αγορές υπολογιστικής ισχύος Azure ύψους 30 δισ. δολαρίων.

Παράλληλα, η Uber βρίσκεται αντιμέτωπη με προκλήσεις που σχετίζονται με τη χρήση αντίστοιχων εργαλείων, αλλά και με το αυξημένο κόστος που αυτά επιφέρουν. Ο CTO της εταιρείας, Praveen Neppalli Naga, δήλωσε τον Απρίλιο στο The Information ότι η εταιρεία εξάντλησε σε μόλις τέσσερις μήνες ολόκληρο τον προϋπολογισμό του 2026 για εργαλεία κώδικα AI. Νωρίτερα, η Uber είχε ενθαρρύνει ενεργά την υιοθέτηση, δημιουργώντας εσωτερικούς πίνακες κατάταξης που αξιολογούσαν τις ομάδες με βάση τη χρήση εργαλείων AI.

Το κύμα ενθάρρυνσης για όσο το δυνατόν μεγαλύτερη χρήση AI δεν περιορίζεται εκεί. Σε εσωτερικό επίπεδο, εργαζόμενος της Meta δημιούργησε πίνακα κατάταξης με το όνομα Claudeonomics για να καταγράφει ποιοι χρησιμοποιούν περισσότερο AI. Η Amazon παροτρύνει τους εργαζομένους να “toxenmaxx”, δηλαδή να καταναλώνουν όσο περισσότερα AI tokens γίνεται.

Με τιμολόγηση που βασίζεται σε tokens, το κόστος αυξάνεται όσο μεγαλώνει η χρήση και βελτιώνεται η αποδοτικότητα. Η Goldman Sachs εκτιμά ότι η agentic AI μπορεί να οδηγήσει σε 24 φορές μεγαλύτερη κατανάλωση tokens έως το 2030, φτάνοντας τα 120 τετράκις εκατομμύρια tokens τον μήνα. Καθώς επιχειρήσεις υιοθετούν AI agents για παραγωγικότητα, το συνολικό κόστος μπορεί να αυξηθεί σημαντικά ακόμη και αν η τιμή ανά token μειώνεται.

Η Gartner προβλέπει ότι έως το 2030 το κόστος inference σε LLM ενός τρισεκατομμυρίου παραμέτρων θα είναι σχεδόν 90% χαμηλότερο σε σχέση με το 2025. Ωστόσο, η φθηνότερη τιμή ανά token δεν αναμένεται να μεταφραστεί σε φθηνότερη επιχειρησιακή AI, επειδή τα agentic μοντέλα απαιτούν πολύ περισσότερα tokens ανά εργασία, η αυξημένη κατανάλωση μπορεί να ξεπεράσει τη μείωση της τιμής ανά μονάδα και οι πάροχοι δεν θα μετακυλίσουν πλήρως τις μειώσεις κόστους. Ο αναλυτής Will Sommer της Gartner προειδοποιεί ότι οι επικεφαλής προϊόντος δεν πρέπει να συγχέουν την πτώση της τιμής των tokens με την ευρύτερη διάθεση προηγμένης ικανότητας συλλογισμού.

Το οικονομικό βάρος γίνεται αισθητό και από παρόχους τεχνολογίας. Ο Bryan Catanzaro της Nvidia τόνισε σε συνέντευξή του στο Axios ότι για την ομάδα του το κόστος υπολογισμών υπερβαίνει κατά πολύ το μισθολογικό κόστος. Την ίδια στιγμή, ο διευθύνων σύμβουλος Jensen Huang περιέγραψε ένα μέλλον στο οποίο 100 AI agents θα συνεργάζονται με κάθε εργαζόμενο στη Nvidia.

Σε κάθε περίπτωση οι τελευταίες κινήσεις υπογραμμίζουν το παράδοξο των φθηνότερων tokens και των μεγαλύτερων λογαριασμών. Καθώς η υιοθέτηση εντείνεται, το κόστος παραμένει επίμονο εμπόδιο και αναγκάζει μεγάλες εταιρείες να επαναξιολογούν την εσωτερική χρήση εργαλείων AI. Αν η κατανάλωση αυξάνεται ταχύτερα από τη μείωση του κόστους ανά μονάδα, το όραμα για ευρεία ανάπτυξη agentic AI ενδέχεται να συνοδευτεί από σημαντικά υψηλότερο λογαριασμό.

Προσθήκη του financialreport.gr ως
προτεινόμενη πηγή στην Google
googlenews

Ακολουθήστε το financialreport.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

close menu