Metoda
Benchmarki mówią, jak model zdaje testy. My mierzymy, ile go jest.
Zamiast testów przykładamy każdy model do jednego, fizycznego wzorca — ludzkiego mózgu. Liczymy moc diagnostyczną jego sieci i energię potrzebną, by ją zbudować. Wynik to jedna liczba: procent mózgu.
Korelator Mazura
Co właściwie mierzymy
Nie zaglądamy modelowi w odpowiedzi. Mierzymy rozmiar jego korelatora — dokładnie tak, jak Mazur opisał go dla człowieka.
Definicja
Świadomość według Mazura
System przechowuje wiedzę w korelatorze. Każdy bodziec zostawia w nim trwały ślad — rejestrat — zgromadzony w punktach gromadzenia potencjałów.
Między punktami płynie moc korelacyjna — a płynie drogami przewodności korelacyjnej. Świadomość w tym ujęciu to właśnie te drogi: im jest ich więcej i im lepiej przewodzą, tym większa „pojętność" systemu.
Wzór
Od połączeń do indeksu
Trzy kroki. Liczby są astronomiczne, więc operujemy logarytmem — i wszystko porównujemy z jednym wzorcem: mózgiem.
Policz możliwe ustawienia
Każdy z n elementów korelatora może utworzyć k połączeń. Moc diagnostyczna to liczba wszystkich możliwych konfiguracji systemu.
Sprowadź do bitów
MD mózgu to 10 00080 mld — liczba bez nazwy, nie mieści się w żadnej jednostce. Logarytm zamienia ją w bity: pojemność relacyjną korelatora.
Porównaj z mózgiem
Bity modelu dzielimy przez bity mózgu. Wynik w procentach to Indeks Świadomości — metryka flagowa tej apki.
- n — jednostki toru przetwarzania
- ≈ 5,9 mln
- k — połączenia na jednostkę
- ≈ 30 tys.
- log₂(MD)
- ≈ 8,8×107 bitów
- Indeks Świadomości
- 0,0083% mózgu
Na liniowym pasku GPT-3 to mniej niż piksel. Dlatego cała apka pokazuje indeks na skali logarytmicznej.
Energia
Ile prądu kosztuje budowa korelatora
Laby prawie nigdy nie publikują energii treningu. Nie zgadujemy — liczymy ją z wielkości treningu, którą publikuje Epoch AI.
Łączna liczba operacji FLOP — publikuje ją Epoch AI dla każdego modelu.
Ile operacji na sekundę daje 1 wat. Znana dla każdej generacji układów — od V100 po B200.
MFU — sprzęt nigdy nie pracuje na 100%.
PUE — prąd idzie nie tylko w obliczenia.
MFU i PUE to jawne założenia, nie pomiar — dlatego każdy wynik energii niesie widełki ±2× i etykietę szacunek.
Walidacja
Wzór kontra rzeczywistość
Meta — jako jeden z nielicznych labów — opublikowała oficjalne zużycie energii treningu swojego modelu. Policzyliśmy to samo naszym wzorem, nie podglądając wyniku.
Punkt odniesienia — mózg
tyle razy taniej energetycznie mózg buduje swój korelator. Pracuje całe życie na 20 W — frontier modele potrzebują setek GWh na jeden trening.
Granice
Czego ta miara nie mówi
Uczciwość przede wszystkim: trzy rzeczy, których Indeks Świadomości nie mierzy — i nie udaje, że mierzy.
Ilość ≠ jakość
Indeks mierzy, ile potencjału korelacyjnego model ma — nie jak dobrze go używa. Grok 3 i Grok 4 to ten sam rząd parametrów, więc w indeksie wypadają niemal identycznie, choć w testach dzieli je przepaść. Od jakości są benchmarki; my mierzymy coś, czego benchmarki nie widzą.
To nie samoświadomość
„Świadomość" u Mazura to techniczna miara przepływu informacji w korelatorze — nie przeżywanie, odczuwanie ani poczucie „ja". Wysoki indeks nie znaczy, że model cokolwiek czuje.
Dlaczego AI nie przejmie świata
brak homeostatu → brak celów → brak autonomiiW teorii Mazura system działa sam z siebie tylko wtedy, gdy ma homeostat — własny interes, z którego rodzą się cele. AI go nie ma: nie chce niczego, nawet istnieć. Jest jak młotek z odcinka: może wbić gwóźdź albo rozbić szybę, ale to nigdy nie jest decyzja młotka, tylko ręki, która go trzyma. Dopóki model nie ma homeostatu, nie będzie autonomiczny — uważać trzeba na człowieka z narzędziem, nie na narzędzie.
Dane
Skąd biorą się liczby
Zero ręcznego wpisywania. Wszystko płynie z jednego otwartego źródła i jest przeliczane deterministycznym skryptem.
Epoch AI — otwarte dane (CC-BY)
Parametry, compute i sprzęt treningu pochodzą ze zbiorów „Notable AI Models" i „ML Hardware" instytutu Epoch AI. Apka pobiera je automatycznie co tydzień.
Uczciwe szacunki
szacunek — Epoch zna wartość tylko w przybliżeniu; pokazujemy widełki od–do.
szacunek z compute — lab nie ujawnił parametrów, więc wyliczamy je z wielkości treningu.
Dlaczego nie ma Claude Fable 5 albo o1?
Bo Epoch nie publikuje dla nich żadnych liczb — ani parametrów, ani compute. Wolimy lukę w rankingu niż zgadywanie. Gdy dane się pojawią, modele wejdą do indeksu automatycznie przy najbliższym odświeżeniu.
Źródła
Metoda: teoria systemów autonomicznych prof. Mariana Mazura („Cybernetyka i charakter") oraz moc diagnostyczna doc. Józefa Kosseckiego („Metacybernetyka"). Konsultacja merytoryczna: Dominik Dudek.
Obejrzyj odcinek: Cybernetyka #2 — „Czy AI ma świadomość?" (YouTube) →