נקסט זה היה ניסוי לרעיון של סינון תמונות אנושי.
אני יביא לכם קצת מהדרך שבה הלכנו וניסנו כדי להגיע לתוצאה הזאת.
בנינו סורק אוטומטי שעובד מאחורי הקלעים ואוסף מהאתר את כל הלינקים של התמונות.
שמנו את הכל במסד נתונים. ובנינו ממשק שאפשר לדרג דרכו את התמונות.
ככה נראה הממשק.
צפה בקובץ המצורף 215778
אשתי התנדבה לעבוד על הסינון של התמונות. והיא הצליחה להגיע למהירות של כ 10,000 תמונות בשעה.
יותר מהר ממה שהשרת סרק את התמונות.
היה הרבה באגים ותקלות וזה נמשך שבוע שלם.
בנינו מחלקה לזיהוי תמונות דומות כדי לחסוך את הדירוג של תמונות הכפולות (יש לכל תמונה כמה גירסאות של גודל).
ובמספרים:
מספר התמונות שנסרקו עד כה בנקסט : 107,910
מתוכם דורגו בידי אדם. כ 62,975 כל השאר דורגו ע"י זיהוי של התמונות הזהות.
מספר הדפים שנסרקו בנקסט 167,835.