Profil modelu

BERT-Large

Google·USA·X 2018·język

Indeks Świadomości

0,0001%

widełki: 4,6×10⁻⁵%–0,0002%

Moc diagnostyczna

1,1×10⁶ bitów

widełki: 4,9×10⁵–2,4×10⁶

Energia treningu

2 MWh

widełki: 1 MWh–3 MWhsprzęt: Google TPU v2

Sprawność

0,9 bit/J

bitów wzorca z 1 dżula energii treningu

Ile drogi do mózgu?iSkala jest logarytmiczna: każdy równy odcinek paska oznacza ok. 10-krotny wzrost indeksu. Lewy kraniec to 10⁻⁷% (poniżej najsłabszego zmierzonego modelu), prawy — pełny parytet z mózgiem.

0,0001%

10⁻⁷%

Mózg (100%)

BERT-Large osiąga 0,0001% potencjału mózgu — mózg ma ok. 970 000× więcej. Pasek jest logarytmiczny, więc każdy równy odcinek to ok. 10× wzrost.

W dniu publikacji (X 2018) BERT-Large wyprzedzało go 11 modeli — na czele z:

W dniu premiery

#12

Do ówczesnego lidera

×39,0

Modeli przed premierą

Porównanie obejmuje 170 modeli ze zbioru — „#1” = najwyższy Indeks Świadomości wśród modeli opublikowanych przed premierą.

#140 z 170

Każdy szary punkt to jeden z 170 modeli; BERT-Large wyróżniony kolorem. Oś pionowa jest logarytmiczna, a przerywana linia u góry to mózg (100%).