x rastlantı değişkenine ilişkin p(x) gibi bir olasılık dağılımı için x'ler üzerinden -p(x)*lg[p(x)] toplamına eşittir. bu değer, x olayının sonucunu öğrendiğimizde kazandığımız bilginin bit cinsinden ifadesidir. işin ilginç yanı,
shannon'un bilgi kuramını oluştururken bulduğu bu ifadenin,
gibbs'in belki yüz sene önce termodinamik sistemler için bulduğu entropi ifadesiyle birebir örtüşüyor olmasıdır.
(bkz:
gibbs entropisi)