Το TurboQuant προκαλεί σοκ στις μετοχές μνήμης, αλλά δεν ανατρέπει τη δομή της αγοράς HBM για AI

Ο νέος αλγόριθμος της Google υπόσχεται να μειώσει τις απαιτήσεις μνήμης των μοντέλων τεχνητής νοημοσύνης κατά έξι φορές. Οι μετοχές της Samsung, της SK Hynix και της Micron σημειώνουν πτώση λόγω φόβων για μείωση της ζήτησης.

Με μια πρώτη ματιά, αυτό μοιάζει με την αρχή του τέλους του υπερκύκλου των μνημών, αλλά στην πραγματικότητα μπορεί να πρόκειται περισσότερο για μια περίπτωση αντίδρασης της αγοράς σε πανικό σε μια σύνθετη τεχνολογική ανακοίνωση. Η TurboQuant, εν τω μεταξύ, είναι μια εργαστηριακή ανακάλυψη που επικεντρώνεται κυρίως στην αποδοτικότερη εξαγωγή συμπερασμάτων και στην mainstream DRAM, ενώ η δομική ιστορία της HBM υψηλής χωρητικότητας -το βασικό καύσιμο για την εκπαίδευση μεγάλων μοντέλων τεχνητής νοημοσύνης- παραμένει άθικτη και συνεχίζει να υποφέρει από ελλείψεις προσφοράς, αυξανόμενη ζήτηση και ισχυρά θεμελιώδη μεγέθη υπέρ των μεγάλων κατασκευαστών μνήμης.

Η επαναστατική τεχνολογία προκαλεί πανικό στην αγορά

Η Google Research $GOOG παρουσίασε έναν νέο αλγόριθμο συμπίεσης μνήμης με την ονομασία TurboQuant , ο οποίος σύμφωνα με τους ερευνητές μπορεί να συμπιέσει τη βασική μνήμη cache που χρησιμοποιείται σε μεγάλα γλωσσικά μοντέλα τουλάχιστον έξι φορές πιο γρήγορα με έως και οκτώ φορές ταχύτερη εξαγωγή συμπερασμάτων, χωρίς να θυσιάζεται η ακρίβεια .

Η αντίδραση της αγοράς ήταν άμεση και δραματική. Την Πέμπτη, οι μετοχές των δύο μεγαλύτερων κατασκευαστών τσιπ μνήμης στον κόσμο, SK Hynix και Samsung $SSNLF, έπεσαν 6% και σχεδόν 5% αντίστοιχα στις συναλλαγές της Νότιας Κορέας. Η Samsung Electronics έκλεισε με πτώση 4,71%, ενώ η SK Hynix υποχώρησε κατά 6,23%, παρασύροντας τον νοτιοκορεατικό δείκτη αναφοράς KOSPI κατά 3,22% .

Παρόμοια τάση συνεχίστηκε και στις αμερικανικές αγορές, όπου οι μετοχές εταιρειών όπως η Micron Technology $MU, η οποία υποχώρησε 7% , και η SanDisk $SNDK, η οποία υποχώρησε 6,8% . Οι κινήσεις αυτές ακολούθησαν την πτώση των μετοχών της SanDisk και της Micron στις ΗΠΑ την Τετάρτη .

Πώς λειτουργεί η TurboQuant και γιατί τρομάζει τους επενδυτές

Η TurboQuant αντιπροσωπεύει μια επαναστατική προσέγγιση για την επίλυση ενός από τα μεγαλύτερα σημεία συμφόρησης της τεχνητής νοημοσύνης - τις τεράστιες απαιτήσεις μνήμης κατά τη διάρκεια των πράξεων εξαγωγής συμπερασμάτων. Το TurboQuant είναι μια μέθοδος συμπίεσης που επιτυγχάνει υψηλή μείωση του μεγέθους του μοντέλου με μηδενική απώλεια ακρίβειας, καθιστώντας το ιδανικό για την υποστήριξη τόσο της συμπίεσης της κρυφής μνήμης κλειδιών (KC) όσο και της διανυσματικής αναζήτησης.

Η τεχνολογία λειτουργεί σε δύο φάσεις. Η πρώτη φάση χρησιμοποιεί το PolarQuant, το οποίο σκέφτεται διαφορετικά για την απεικόνιση του χώρου υψηλών διαστάσεων. Αντί να χρησιμοποιεί τις τυπικές καρτεσιανές συντεταγμένες (X, Y, Z), το PolarQuant μετατρέπει τα διανύσματα σε πολικές συντεταγμένες που αποτελούνται από μια ακτίνα και ένα σύνολο γωνιών. Η καινοτομία έγκειται στη γεωμετρία: μετά από τυχαία περιστροφή, η κατανομή αυτών των γωνιών γίνεται εξαιρετικά προβλέψιμη και συγκεντρωμένη.

Η δεύτερη φάση λειτουργεί ως διορθωτής μαθηματικών σφαλμάτων. Ακόμη και με την αποτελεσματικότητα του PolarQuant, παραμένει ένα υπόλοιπο σφάλματος. Το TurboQuant εφαρμόζει έναν κβαντισμένο μετασχηματισμό Johnson-Lindenstrauss (QJL) 1 bit σε αυτά τα υπολειπόμενα δεδομένα.

Ο πραγματικός αντίκτυπος στην αγορά παραμένει ένα ερώτημα

Παρά την άμεση αντίδραση της αγοράς, οι αναλυτές προειδοποιούν κατά των υπερβολικών ανησυχιών. Ο Ray Wang, αναλυτής μνήμης στην SemiAnalysis, δήλωσε ότι η έρευνα της Google δεν θα οδηγήσει απαραίτητα στην ανάγκη για λιγότερα τσιπ. Οι τιμές της κρυφής μνήμης είναι "ένα βασικό σημείο συμφόρησης που πρέπει να αντιμετωπιστεί για καλύτερα μοντέλα και επιδόσεις υλικού", είπε. Ο Wang δήλωσε ότι θα είναι "δύσκολο να αποφευχθεί η υψηλότερη κατανάλωση μνήμης" ως αποτέλεσμα της βελτίωσης των επιδόσεων των μοντέλων .

Είναι επίσης σημαντικό να γίνει διάκριση μεταξύ των διαφόρων τύπων μνήμης. Θα πρέπει να σημειωθεί ότι σε σύγκριση με τα τυπικά τσιπ DRAM, αυτή η τεχνολογία θα έχει μικρότερο αντίκτυπο στην HBM (μνήμη υψηλού εύρους ζώνης). Το TurboQuant χρησιμοποιείται κυρίως για τη βελτιστοποίηση του συμπερασμού των μοντέλων ΤΝ, μια φάση που απαιτεί ως επί το πλείστον μόνο συνηθισμένα τσιπ DRAM. Ωστόσο, η HBM παραμένει απαραίτητη στη φάση εκπαίδευσης της ΤΝ.

Σύμφωνα με δημοσίευμα του CNBC, παρά την πτώση της μετοχής την Πέμπτη, μια τέλεια καταιγίδα παραγόντων συνεχίζει να στηρίζει μακροπρόθεσμα την αγορά μνήμης. Η σημαντική ζήτηση σε συνδυασμό με τις ελλείψεις στην προσφορά ώθησαν τις τιμές της μνήμης σε πρωτοφανή επίπεδα και στήριξαν τα κέρδη των Samsung, SK Hynix και Micron .

Τα διαρθρωτικά θεμελιώδη μεγέθη παραμένουν σταθερά

Είναι επίσης σημαντικό να θυμόμαστε ότι η TurboQuant εξακολουθεί να είναι μόνο ένα ερευνητικό έργο. Αξίζει να σημειωθεί ότι το TurboQuant δεν έχει ακόμη αναπτυχθεί σε μεγαλύτερη κλίμακα- προς το παρόν εξακολουθεί να αποτελεί μια εργαστηριακή ανακάλυψη. Αυτό καθιστά πιο δύσκολες τις συγκρίσεις με κάτι όπως η DeepSeek, ή ακόμη και με τη φανταστική εταιρεία Pied Piper.

Τα στοιχεία δείχνουν ότι το μέγεθος της αγοράς HBM θα αυξηθεί κατά 58% στα 54,6 δισεκατομμύρια δολάρια το 2026, αντιπροσωπεύοντας σχεδόν το 40% της αγοράς DRAM. Η ξαφνική αύξηση της ζήτησης έχει οδηγήσει σε ανισορροπία μεταξύ προσφοράς και ζήτησης. Παρά το γεγονός ότι η Samsung, η SK Hynix και η Micron διαθέτουν το 70% της νέας/πρόσθετης χωρητικότητάς τους σε HBM, παραμένει ένα κενό χωρητικότητας 50-60% για HBM.

Σύμφωνα με τους αναλυτές της Wells Fargo, η ενημέρωση της Google TurboQuant θα μπορούσε να είναι πραγματικά θετική για τις εταιρείες μνήμης. Αν και αυτού του είδους η επανάσταση μπορεί να φαίνεται αρνητική για τις εταιρείες μνήμης, η ιδέα του παράδοξου του Jevons υποδηλώνει ότι μπορεί να συμβεί το αντίθετο - η αποτελεσματικότερη τεχνητή νοημοσύνη μειώνει το κόστος, γεγονός που μπορεί στην πραγματικότητα να ενθαρρύνει πολύ ευρύτερη χρήση και ζήτηση .

Οι διαρθρωτικές κινητήριες δυνάμεις που συνδέονται με την υποδομή AI, οι περιορισμοί στην προσφορά και οι στενές αγορές HBM υποστηρίζουν μια ανθεκτική μακροπρόθεσμη προοπτική. Οι επενδυτές θα πρέπει να διακρίνουν μεταξύ του βραχυπρόθεσμου θορύβου και των θεμελιωδών τάσεων που εδράζονται στην επίμονη έλλειψη μνήμης και στην επέκταση των φορτίων εργασίας AI .

Κοινοποίηση

Δεν υπάρχουν σχόλια ακόμα
Οι πληροφορίες σε αυτό το άρθρο είναι μόνο για εκπαιδευτικούς σκοπούς και δεν αποτελούν επενδυτικές συμβουλές. Οι συγγραφείς παρουσιάζουν μόνο γεγονότα που τους είναι γνωστά και δεν εξάγουν συμπεράσματα ή συστάσεις για τους αναγνώστες. Διαβάστε τους Όρους και Προϋποθέσεις μας
Menu StockBot
Tracker
Upgrade