Τεχνολογία

Η κινεζική DeepSeek λανσάρει μοντέλο τεχνητής νοημοσύνης επόμενης γενιάς

Financialreport.gr 30.09.2025 | 14:51

Πρόκειται για μια πειραματική έκδοση του τρέχοντος μοντέλου DeepSeek-V3.1-Terminus

Το τελευταίο πειραματικό μοντέλο της κινεζικής νεοσύστατης εταιρείας DeepSeek υπόσχεται να αυξήσει την αποτελεσματικότητα και να βελτιώσει την ικανότητα της Τεχνητής Νοημοσύνης να χειρίζεται πολλές πληροφορίες με ένα κλάσμα του κόστους, αλλά παραμένουν ερωτήματα σχετικά με το πόσο αποτελεσματική και ασφαλής είναι η αρχιτεκτονική, όπως μεταδίδει το CNBC.

Το DeepSeek προκάλεσε πανικό στη Silicon Valley όταν κυκλοφόρησε ξαφνικά το πρώτο της μοντέλο R1 πέρυσι, δείχνοντας ότι είναι δυνατή η γρήγορη εκπαίδευση μεγάλων γλωσσικών μοντέλων (LLM), σε λιγότερο ισχυρά τσιπ, χρησιμοποιώντας λιγότερους πόρους.

Η εταιρεία κυκλοφόρησε το DeepSeek-V3.2-Exp τη Δευτέρα, μια πειραματική έκδοση του τρέχοντος μοντέλου DeepSeek-V3.1-Terminus, το οποίο βασίζεται περαιτέρω στην αποστολή της να αυξήσει την αποδοτικότητα στα συστήματα τεχνητής νοημοσύνης, σύμφωνα με μια ανάρτηση στο φόρουμ τεχνητής νοημοσύνης Hugging Face .

«Το DeepSeek V3.2 συνεχίζει να εστιάζει στην αποτελεσματικότητα, τη μείωση του κόστους και την κοινή χρήση ανοιχτού κώδικα», δήλωσε στο CNBC η Adina Yakefu, επικεφαλής της κινεζικής κοινότητας στο Hugging Face. «Η μεγάλη βελτίωση είναι μια νέα λειτουργία που ονομάζεται DSA (DeepSeek Sparse Attention), η οποία κάνει την τεχνητή νοημοσύνη καλύτερη στη διαχείριση μεγάλων εγγράφων και συνομιλιών. Μειώνει επίσης το κόστος λειτουργίας της τεχνητής νοημοσύνης στο μισό σε σύγκριση με την προηγούμενη έκδοση».

«Είναι σημαντικό επειδή θα πρέπει να κάνει το μοντέλο πιο γρήγορο και πιο οικονομικό στη χρήση χωρίς αισθητή μείωση της απόδοσης», δήλωσε ο Nick Patience, αντιπρόεδρος και επικεφαλής πρακτικής για την Τεχνητή Νοημοσύνη στο The Futurum Group. «Αυτό καθιστά την ισχυρή Τεχνητή Νοημοσύνη πιο προσβάσιμη σε προγραμματιστές, ερευνητές και μικρότερες εταιρείες, οδηγώντας ενδεχομένως σε ένα κύμα νέων και καινοτόμων εφαρμογών».

Τα πλεονεκτήματα και τα μειονεκτήματα της περιορισμένης προσοχής

Ένα μοντέλο Τεχνητής Νοημοσύνης λαμβάνει αποφάσεις με βάση τα δεδομένα εκπαίδευσής του και νέες πληροφορίες, όπως μια προτροπή. Ας υποθέσουμε ότι μια αεροπορική εταιρεία θέλει να βρει την καλύτερη διαδρομή από το σημείο Α στο σημείο Β, ενώ υπάρχουν πολλές επιλογές, δεν είναι όλες εφικτές. Φιλτράροντας τις λιγότερο βιώσιμες διαδρομές, μειώνετε δραματικά τον χρόνο, τα καύσιμα και, τελικά, τα χρήματα που απαιτούνται για να πραγματοποιηθεί το ταξίδι. Αυτό ακριβώς κάνει η αραιή προσοχή, λαμβάνει υπόψη μόνο τα δεδομένα που θεωρεί σημαντικά δεδομένης της εργασίας που έχει αναλάβει, σε αντίθεση με άλλα μοντέλα μέχρι στιγμής που έχουν επεξεργαστεί όλα τα δεδομένα του μοντέλου.

«Ουσιαστικά, λοιπόν, αφαιρείς πράγματα που θεωρείς ότι δεν είναι σημαντικά», δήλωσε η Ekaterina Almasque, συνιδρύτρια και διευθύνουσα σύμβουλος του νέου fund επιχειρηματικών κεφαλαίων BlankPage Capital.

Η περιορισμένη προσοχή αποτελεί πλεονέκτημα για την αποτελεσματικότητα και την ικανότητα κλιμάκωσης της Τεχνητής Νοημοσύνης, δεδομένου ότι απαιτούνται λιγότεροι πόροι, αλλά μια ανησυχία είναι ότι θα μπορούσε να οδηγήσει σε μείωση της αξιοπιστίας των μοντέλων λόγω της έλλειψης εποπτείας ως προς το πώς και γιατί υποτιμά τις πληροφορίες.

«Η πραγματικότητα είναι ότι [τα μοντέλα αραιής προσοχής] έχουν χάσει πολλές αποχρώσεις», δήλωσε ο Almasque, ο οποίος ήταν πρώιμος υποστηρικτής των Dataiku και Darktrace και επενδυτής στην Graphcore. «Και τότε το πραγματικό ερώτημα είναι, είχαν τον σωστό μηχανισμό για να αποκλείσουν μη σημαντικά δεδομένα ή υπάρχει κάποιος μηχανισμός που αποκλείει πραγματικά σημαντικά δεδομένα και τότε το αποτέλεσμα θα είναι πολύ λιγότερο σχετικό;»

Αυτό θα μπορούσε να είναι ιδιαίτερα προβληματικό για την ασφάλεια και την συμπερίληψη της Τεχνητής Νοημοσύνης, σημείωσε ο επενδυτής, προσθέτοντας ότι μπορεί να μην είναι «το βέλτιστο ή το ασφαλέστερο» μοντέλο Τεχνητής Νοημοσύνης για χρήση σε σύγκριση με τους ανταγωνιστές ή τις παραδοσιακές αρχιτεκτονικές.

Ωστόσο, η DeepSeek λέει ότι το πειραματικό μοντέλο λειτουργεί στο ίδιο επίπεδο με το V3.1-Terminus. Παρά τις εικασίες για σχηματισμό φούσκας , η Τεχνητή Νοημοσύνη παραμένει στο επίκεντρο του γεωπολιτικού ανταγωνισμού, με τις ΗΠΑ και την Κίνα να ανταγωνίζονται για τη νικήτρια θέση. Ο Yakefu σημείωσε ότι τα μοντέλα της DeepSeek λειτουργούν «αμέσως μόλις τα βγάλετε από το κουτί» με τσιπ Τεχνητής Νοημοσύνης κινεζικής κατασκευής, όπως τα Ascend και Cambricon, πράγμα που σημαίνει ότι μπορούν να λειτουργούν τοπικά σε εγχώριο υλικό χωρίς καμία επιπλέον ρύθμιση.

Η DeepSeek μοιράστηκε επίσης τον πραγματικό κώδικα προγραμματισμού και τα εργαλεία που απαιτούνται για τη χρήση του πειραματικού μοντέλου, είπε. «Αυτό σημαίνει ότι και άλλοι άνθρωποι μπορούν να μάθουν από αυτό και να δημιουργήσουν τις δικές τους βελτιώσεις».

Αλλά για την Almasque, η ίδια η φύση αυτού σημαίνει ότι η τεχνολογία μπορεί να μην είναι υπερασπίσιμη. «Η προσέγγιση δεν είναι εξαιρετικά καινούργια», είπε, σημειώνοντας ότι ο κλάδος «μιλάει για σπάνια μοντέλα από το 2015» και ότι η DeepSeek δεν είναι σε θέση να κατοχυρώσει με δίπλωμα ευρεσιτεχνίας την τεχνολογία της λόγω του ανοιχτού κώδικα. Το ανταγωνιστικό πλεονέκτημα της DeepSeek, επομένως, πρέπει να έγκειται στον τρόπο με τον οποίο αποφασίζει ποιες πληροφορίες θα συμπεριλάβει, πρόσθεσε.

Η ίδια η εταιρεία αναγνωρίζει ότι η έκδοση V3.2-Exp είναι ένα «ενδιάμεσο βήμα προς την αρχιτεκτονική επόμενης γενιάς μας», σύμφωνα με την ανάρτηση στο Hugging Face.

Όπως επεσήμανε η Patience, «αυτό είναι το βασικό στοιχείο του DeepSeek: η αποδοτικότητα γίνεται εξίσου σημαντική με την ακατέργαστη ισχύ».

«Το DeepSeek παίζει μακροπρόθεσμα το παιχνίδι για να κρατήσει την κοινότητα αφοσιωμένη στην πρόοδό της», πρόσθεσε ο Yakefu. «Οι άνθρωποι θα επιλέγουν πάντα αυτό που είναι φθηνό, αξιόπιστο και αποτελεσματικό».

ΕΙΔΗΣΕΙΣ ΣΗΜΕΡΑ:

Ακολουθήστε το financialreport.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

TAGS:

Επιχειρήσεις

Επιχειρήσεις

03.04.2026

Η Microsoft επενδύει 10 δισ. δολάρια στην Ιαπωνία για AI, κυβερνοάμυνα, εκπαίδευση

Επιχειρήσεις

03.04.2026

Φουντώνουν τα σενάρια για την εξαγορά της Epic Games από την Disney

Επιχειρήσεις

03.04.2026

Premia Properties: Επιτυχής έκδοση ομολόγου 150 εκατ. ευρώ – Υπερκαλύφθηκε η έκδοση 1,4 φορές

Επιχειρήσεις

03.04.2026

M. Ο’ Leary (Ryan Air): Αν ο πόλεμος δεν τελειώσει πριν το καλοκαίρι, ίσως θα δούμε και ακυρώσεις πτήσεων

Επιχειρήσεις

03.04.2026

Σε εγρήγορση ο Εμπορικός Σύλλογος Πειραιά για το κύμα ακρίβειας και το ενεργειακό κόστος

Επιχειρήσεις

03.04.2026

Στα 393 δις δολάρια η αγορά των ρούχων από δεύτερο χέρι μέχρι το 2030

Επιχειρήσεις

03.04.2026

Μασούτης: Η κρίση μας επηρεάζει όλους

Επιχειρήσεις

03.04.2026

Η κινεζική DeepSeek λανσάρει μοντέλο τεχνητής νοημοσύνης επόμενης γενιάς

Πρόκειται για μια πειραματική έκδοση του τρέχοντος μοντέλου DeepSeek-V3.1-Terminus

ΕΙΔΗΣΕΙΣ ΣΗΜΕΡΑ:

TAGS:

ΡΟΗ ΕΙΔΗΣΕΩΝ

Παράταση της μείωσης των φόρων στα καύσιμα στην Ιταλία

Ο υπ. Άμυνας των ΗΠΑ, Πιτ Χέγκσεθ, επέλυσε τον αρχηγό του Γενικού Επιτελείου Στρατού

Τέμπη – Καρυστιανού για την επ’ αόριστον αναβολή της δίκης για τα βίντεο: Δόλιος ελιγμός, χωρίς νομικό έρεισμα

Συνολικά 20 κρούσματα αφθώδους πυρετού σε 25 θετικές εκτροφές

Υπόθεση Παναγόπουλου: «Έφοδος» στο σπίτι και το γραφείο του προέδρου της ΓΣΕΕ

Σχοινάς, Λαζαρίδης και Τουρνάς τα νέα πρόσωπα στην κυβέρνηση μετά τον ανασχηματισμό λόγω ΟΠΕΚΕΠΕ

ΕΛΣΤΑΤ: Μικρή μείωση 0,9% στα επισκευασθέντα πλοία – Ανοδος 3,5% στη συνολική χωρητικότητα

Σκάνδαλο ΟΠΕΚΕΠΕ: Παραιτήθηκαν Τσιάρας, Κεφαλογιάννης και Βαρτζόπουλος – Ανακοινώνονται οι αντικαταστάτες

Επιχειρήσεις

Η Microsoft επενδύει 10 δισ. δολάρια στην Ιαπωνία για AI, κυβερνοάμυνα, εκπαίδευση

Φουντώνουν τα σενάρια για την εξαγορά της Epic Games από την Disney

Premia Properties: Επιτυχής έκδοση ομολόγου 150 εκατ. ευρώ – Υπερκαλύφθηκε η έκδοση 1,4 φορές

M. Ο’ Leary (Ryan Air): Αν ο πόλεμος δεν τελειώσει πριν το καλοκαίρι, ίσως θα δούμε και ακυρώσεις πτήσεων

Σε εγρήγορση ο Εμπορικός Σύλλογος Πειραιά για το κύμα ακρίβειας και το ενεργειακό κόστος

Στα 393 δις δολάρια η αγορά των ρούχων από δεύτερο χέρι μέχρι το 2030

Μασούτης: Η κρίση μας επηρεάζει όλους

Η OpenAI επεκτείνεται στον χώρο των media μέσω της εξαγοράς του TBPN