mat
------- Magicode -------
בהמשך לזה אני פותח דיון לגבי המסד נתונים.
שאני הולך לבנות מסד נתונים שאמור להכיל מליוני שורות. צריך לתכנן אותו נכון שיעבוד כמה שיותר מהר.
המסד נותנים שאני רוצה לעשות צריך להיות מבוסס על הדרישות הסינון.
יש אתרים שצריך לסנן את כל האתר כולו.
יש אתרים כמו פרוג. שאותם לא צריך לסנן.כלל.
זה פשוט מאוד להגדיר. http://www.prog.co.il/*
יש אתרים כמו גוגל שחלק מהאתר טוב חלק רע. כמו למשל את החלק של התמונות.
אז פה יש בעיה.
איך בדיוק לסדר את זה.
אם אני הולך לפי מחרוזות regex. וככה לרשום את כל הurls עם כלל ליד זה של פתיחה סגירה.
מה אשם גולש פרוג שהאתר שלו נקי שכל דף ולינק יצטרך להמתין לחיפוש של כל ה urls.
המחשבה שיש לי לעשות את זה ככה.
טבלה ראשונה.
שדות.
domain - מכיל את שם הדומיין כמו למשל prog.co.il
type - מסוג enum יכול להכיל שני ערכים action או cname.
value - מכיל את הערך.
ואז זה עובד ככה שאם זה פתוח או סגור זה יגיב מיד. ואם באמצע הוא יחפש בעוד טבלה את ה url הספציפי.
הבעיה שיש פה זה עם דומיינים כפולים.
כמו s2.domain.com s1.domain.com s3.domain.com s4.domain.com
ככה זה עובד באתר הזה. http://www.filehippo.com/.
אנחנו לא רוצים להגדיר את כל האפשריות יותר קל לעשות ככה *.domain.com
אבל במצב כזה אנחנו משתמשים ב regex שזה לוקח המון משאבים.
התוכנית שלי זה לא כן/לא. יש גם באמצע ולכן השרת של הסינון בנוי בצורה שאפשר להוסיף לו מלא הגדרות סינון. למשל יש אתרים שבהם תוריד תמונות גדולות או תסנן מילים לא יפות.
מי שיש לו רעיון הצעה הערה שיגיב.
שאני הולך לבנות מסד נתונים שאמור להכיל מליוני שורות. צריך לתכנן אותו נכון שיעבוד כמה שיותר מהר.
המסד נותנים שאני רוצה לעשות צריך להיות מבוסס על הדרישות הסינון.
יש אתרים שצריך לסנן את כל האתר כולו.
יש אתרים כמו פרוג. שאותם לא צריך לסנן.כלל.
זה פשוט מאוד להגדיר. http://www.prog.co.il/*
יש אתרים כמו גוגל שחלק מהאתר טוב חלק רע. כמו למשל את החלק של התמונות.
אז פה יש בעיה.
איך בדיוק לסדר את זה.
אם אני הולך לפי מחרוזות regex. וככה לרשום את כל הurls עם כלל ליד זה של פתיחה סגירה.
מה אשם גולש פרוג שהאתר שלו נקי שכל דף ולינק יצטרך להמתין לחיפוש של כל ה urls.
המחשבה שיש לי לעשות את זה ככה.
טבלה ראשונה.
שדות.
domain - מכיל את שם הדומיין כמו למשל prog.co.il
type - מסוג enum יכול להכיל שני ערכים action או cname.
value - מכיל את הערך.
ואז זה עובד ככה שאם זה פתוח או סגור זה יגיב מיד. ואם באמצע הוא יחפש בעוד טבלה את ה url הספציפי.
הבעיה שיש פה זה עם דומיינים כפולים.
כמו s2.domain.com s1.domain.com s3.domain.com s4.domain.com
ככה זה עובד באתר הזה. http://www.filehippo.com/.
אנחנו לא רוצים להגדיר את כל האפשריות יותר קל לעשות ככה *.domain.com
אבל במצב כזה אנחנו משתמשים ב regex שזה לוקח המון משאבים.
התוכנית שלי זה לא כן/לא. יש גם באמצע ולכן השרת של הסינון בנוי בצורה שאפשר להוסיף לו מלא הגדרות סינון. למשל יש אתרים שבהם תוריד תמונות גדולות או תסנן מילים לא יפות.
מי שיש לו רעיון הצעה הערה שיגיב.