10 Aug 2004
CS 5244: Orientation
41/32
Indexing output
¡Output = Lw,DD,IW×D
¡
¡Inverted File (Index)
lPostings (e.g., wt → (d1,fwt,d1), (d2,fwt,d),  …, (dn,fwt,dn)
lVariable length records
¡
¡Lexicon:
lString Wt
lDocument frequency ft
lAddress within inverted file It
lSorted, fixed length records
¡
¡×       D1 D2 D3 D4 D5 D6 … Dm
¡
¡W1           1        1     
¡W2       2            1
¡W3        1      
¡W4                         1           1
¡W5        1           1
¡W6            1       1   1
¡…
¡Wn 
¡
¡
¡
¡
¡
To think about: What type of entries are missing from the search engine index that are present in the book index? 
Wf
2
3
1
2
2
3
Lexicon
Inverted File (Postings File)