<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>&#8235;תגובות לפוסט: &#34;לקריאה נוספת&#34;&#8236;</title>
	<atom:link href="http://www.sciencefriction.net/blog/2008/07/30/135/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.sciencefriction.net/blog/2008/07/30/135/</link>
	<description>&#8235;מעניין. אולי זה אפילו נכון.&#8236;</description> 	<lastBuildDate>Fri, 30 Jul 2010 14:35:30 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
	<item>
		<title>&#8235;מאת: הקולקטיב &#187; &#187; [שכונה] תיכף נדליק את המשואה, גרסת ההייטק&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-4337</link>
		<dc:creator>&#8235;הקולקטיב &#187; &#187; [שכונה] תיכף נדליק את המשואה, גרסת ההייטק&#8236;</dc:creator>		<pubDate>Sat, 09 Aug 2008 06:14:15 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-4337</guid>
		<description>&#8235;[...] אורן צור מנתח מהביט סטטיסטי את שירות &quot;ספרים נוספים&quot; של אמאזון. &quot;&#8230;.מערכות המלצה אוטומטיות  (recommender systems) הן עניין לדון בו. יש בזה הרבה עניין מדעי ולא פחות מכך עניין מסחרי. אבל לא במערכות המלצה יעסוק הפוסט הזה אלא בבן דוד קרוב שלהם - רשימות לקריאה נוספת. לפני כמה חודשים אמזון הוסיפו פיצ&#039;ר חדש לחנות הספרים שלהם והוא &#039;ספרים קשורים&#039; (books on related topics). בינתיים הפיצ&#039;ר הזה לא זמין לכל הספרים (למעשה הוא זמין רק למיעוטם) והוא בהחלט סובל מכמה מחלות בהן אנסה לדון כאן..&quot; http://www.sciencefriction.net/blog/2008/07/30/135/ [...]&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>[...] אורן צור מנתח מהביט סטטיסטי את שירות &quot;ספרים נוספים&quot; של אמאזון. &quot;&#8230;.מערכות המלצה אוטומטיות  (recommender systems) הן עניין לדון בו. יש בזה הרבה עניין מדעי ולא פחות מכך עניין מסחרי. אבל לא במערכות המלצה יעסוק הפוסט הזה אלא בבן דוד קרוב שלהם &#8211; רשימות לקריאה נוספת. לפני כמה חודשים אמזון הוסיפו פיצ'ר חדש לחנות הספרים שלהם והוא 'ספרים קשורים' (books on related topics). בינתיים הפיצ'ר הזה לא זמין לכל הספרים (למעשה הוא זמין רק למיעוטם) והוא בהחלט סובל מכמה מחלות בהן אנסה לדון כאן..&quot; <a href="http://www.sciencefriction.net/blog/2008/07/30/135/" rel="nofollow">http://www.sciencefriction.net/blog/2008/07/30/135/</a> [...]</p>
</div>
]]></content:encoded>
	</item>
	<item>
		<title>&#8235;מאת: פרדוקס ערימת הספרים&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-4211</link>
		<dc:creator>&#8235;פרדוקס ערימת הספרים&#8236;</dc:creator>		<pubDate>Fri, 08 Aug 2008 20:29:08 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-4211</guid>
		<description>&#8235;[...] ערימת הספרים   בפוסט לקריאה נוספת העליתי כמה תהיות לגבי הפיצ&#039;ר של אמזון &#039;ספרים בנושאים [...]&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>[...] ערימת הספרים   בפוסט לקריאה נוספת העליתי כמה תהיות לגבי הפיצ'ר של אמזון 'ספרים בנושאים [...]</p>
</div>
]]></content:encoded>
	</item>
	<item>
		<title>&#8235;מאת: oren with no hebrew&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-3152</link>
		<dc:creator>&#8235;oren with no hebrew&#8236;</dc:creator>		<pubDate>Fri, 01 Aug 2008 14:16:42 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-3152</guid>
		<description>&#8235;I&#039;m not sure it&#039;s relevant only to non-fiction but it might be more relevant to certain genres. 

I also guess they aim at something more focused than just simple categorization (books about biology) but they want books that are really related. 

it is interesting to try and classify the books by the intro, the table of contents or even better - the terms index at the end, I wonder if it was done before (I guess so). 

but lately I came across the opposite challange - automatic creation of the book index according to its contents:
http://www.aclweb.org/anthology-new/P/P08/P08-1106.pdf

this paper is very interesting because it tries to model the cognitive process. results are not prime but very interesting.&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: ltr;'>
<p>I'm not sure it's relevant only to non-fiction but it might be more relevant to certain genres. </p>
<p>I also guess they aim at something more focused than just simple categorization (books about biology) but they want books that are really related. </p>
<p>it is interesting to try and classify the books by the intro, the table of contents or even better &#8211; the terms index at the end, I wonder if it was done before (I guess so). </p>
<p>but lately I came across the opposite challange &#8211; automatic creation of the book index according to its contents:<br />
<a href="http://www.aclweb.org/anthology-new/P/P08/P08-1106.pdf" rel="nofollow">http://www.aclweb.org/anthology-new/P/P08/P08-1106.pdf</a></p>
<p>this paper is very interesting because it tries to model the cognitive process. results are not prime but very interesting.</p>
</div>
]]></content:encoded>
	</item>
	<item>
		<title>&#8235;מאת: דודי&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-3148</link>
		<dc:creator>&#8235;דודי&#8236;</dc:creator>		<pubDate>Fri, 01 Aug 2008 08:07:19 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-3148</guid>
		<description>&#8235;נראה לי שסיווג לפי נושא יותר שימושי לספרי עיון, מאשר לספרות בדיונית. 

לגבי עומס החישוב. לאדם אין צורך לקרוא (או גם לסרוק) את הטקסט המלא של ספר כדי להבין במה הוא עוסק. ייתכן, שמיון על-פי מילות התוכן בהקדמה בלבד, או אפילו רק בתוכן העניינים, ייתן תוצאות לא פחות טובות ממיון על-פי ה-SIP בטקסט כולו. (בספרי עיון כמעט תמיד יהיו מבוא ותוכן עניינים, מלבד אולי ספרים קצרים שאותם אפשר לסרוק במלואם).&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>נראה לי שסיווג לפי נושא יותר שימושי לספרי עיון, מאשר לספרות בדיונית. </p>
<p>לגבי עומס החישוב. לאדם אין צורך לקרוא (או גם לסרוק) את הטקסט המלא של ספר כדי להבין במה הוא עוסק. ייתכן, שמיון על-פי מילות התוכן בהקדמה בלבד, או אפילו רק בתוכן העניינים, ייתן תוצאות לא פחות טובות ממיון על-פי ה-SIP בטקסט כולו. (בספרי עיון כמעט תמיד יהיו מבוא ותוכן עניינים, מלבד אולי ספרים קצרים שאותם אפשר לסרוק במלואם).</p>
</div>
]]></content:encoded>
	</item>
	<item>
		<title>&#8235;מאת: אורן&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-3133</link>
		<dc:creator>&#8235;אורן&#8236;</dc:creator>		<pubDate>Thu, 31 Jul 2008 20:00:58 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-3133</guid>
		<description>&#8235;יובל - 
זה הכל שאלה של הקורפוס הנכון, כלומר מול מה אתה מחשב את הSIP. אמזון כותבים שהם עושים את זה מול ספרים אחרים (כמה? אן לא מול כולם אז איך דוגמים את הספרים?) כל שינוי של הקורפוס, בהנחה שזה לא פשוט אוסף *כל* הספרים האלקטרוניים שלהם יכול לשנות מאוד את התמונה. יש לי כמה ניסויים משלי שאני אפרסם בהזדמנות אבל עוד לא בשלה השעה. 

בכל אופן, השאלה הנוספת היא למה אמזון מאפשרים את הפיצ&#039;ר הזה אם הוא כל כך רועש/לא מדוייק וכו&#039;
(אני גם לא ממש מאמין להם כשהם מסבירים את הSIP. אני בטוח שיש שם עוד מליון החלקות [smoothing] וכמה פאצ&#039;ים וכו&#039; רק שהם לא ששים לשתף. כלומר אם זה היה פועל הם לא היו מספרים לנו איך וכשזה לא פועל הם מתביישים...)&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>יובל &#8211;<br />
זה הכל שאלה של הקורפוס הנכון, כלומר מול מה אתה מחשב את הSIP. אמזון כותבים שהם עושים את זה מול ספרים אחרים (כמה? אן לא מול כולם אז איך דוגמים את הספרים?) כל שינוי של הקורפוס, בהנחה שזה לא פשוט אוסף *כל* הספרים האלקטרוניים שלהם יכול לשנות מאוד את התמונה. יש לי כמה ניסויים משלי שאני אפרסם בהזדמנות אבל עוד לא בשלה השעה. </p>
<p>בכל אופן, השאלה הנוספת היא למה אמזון מאפשרים את הפיצ'ר הזה אם הוא כל כך רועש/לא מדוייק וכו'<br />
(אני גם לא ממש מאמין להם כשהם מסבירים את הSIP. אני בטוח שיש שם עוד מליון החלקות [smoothing] וכמה פאצ'ים וכו' רק שהם לא ששים לשתף. כלומר אם זה היה פועל הם לא היו מספרים לנו איך וכשזה לא פועל הם מתביישים&#8230;)</p>
</div>
]]></content:encoded>
	</item>
	<item>
		<title>&#8235;מאת: יובל&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-3132</link>
		<dc:creator>&#8235;יובל&#8236;</dc:creator>		<pubDate>Thu, 31 Jul 2008 19:42:30 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-3132</guid>
		<description>&#8235;תיאורטית, השימוש ב-SIP
נראה רעיון מצויין.
מעשית, כדאי לעשות צעד נוסף ולהסתכל בנתונים. יש רשימת 
SIPS
 בדף של דה-וינצ&#039;י
http://www.amazon.com/Da-Vinci-Code-Dan-Brown/dp/0385504209
תחת
Key Phrases - Statistically Improbable Phrases (SIPs):  
והם, אפעס, נראים לא משהו, ופחות טובים מהצירופים באותיות רישיות.
כנ&quot;ל אלה במטוטלת של פוקו, ששונים לגמרי מאלה של דה וינצ&#039;י:
http://www.amazon.com/Foucaults-Pendulum-Umberto-Eco/dp/0345368754
נראה לי שהסיגנל הסטטיסטי מהסוג הזה בספר הוא פשוט חלש מדי.
אגב, יכול להיות שמחשבים את ה- SIPS
באופן המתואר אצל מנינג ושוטצה:
http://nlp.stanford.edu/fsnlp/promo/colloc.pdf
השתמשתי פעם בשיטות האלה על &quot;גאווה ודעה קדומה&quot;, וחוץ משמות של דמויות וצירופי מילות יחס לא יצא הרבה.
כמובן, מאוד אפשרי שמהנדסי אמאזון עושים את זה בצורה טובה יותר.&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>תיאורטית, השימוש ב-SIP<br />
נראה רעיון מצויין.<br />
מעשית, כדאי לעשות צעד נוסף ולהסתכל בנתונים. יש רשימת<br />
SIPS<br />
 בדף של דה-וינצ'י<br />
<a href="http://www.amazon.com/Da-Vinci-Code-Dan-Brown/dp/0385504209" rel="nofollow">http://www.amazon.com/Da-Vinci-Code-Dan-Brown/dp/0385504209</a><br />
תחת<br />
Key Phrases &#8211; Statistically Improbable Phrases (SIPs):<br />
והם, אפעס, נראים לא משהו, ופחות טובים מהצירופים באותיות רישיות.<br />
כנ&quot;ל אלה במטוטלת של פוקו, ששונים לגמרי מאלה של דה וינצ'י:<br />
<a href="http://www.amazon.com/Foucaults-Pendulum-Umberto-Eco/dp/0345368754" rel="nofollow">http://www.amazon.com/Foucaults-Pendulum-Umberto-Eco/dp/0345368754</a><br />
נראה לי שהסיגנל הסטטיסטי מהסוג הזה בספר הוא פשוט חלש מדי.<br />
אגב, יכול להיות שמחשבים את ה- SIPS<br />
באופן המתואר אצל מנינג ושוטצה:<br />
<a href="http://nlp.stanford.edu/fsnlp/promo/colloc.pdf" rel="nofollow">http://nlp.stanford.edu/fsnlp/promo/colloc.pdf</a><br />
השתמשתי פעם בשיטות האלה על &quot;גאווה ודעה קדומה&quot;, וחוץ משמות של דמויות וצירופי מילות יחס לא יצא הרבה.<br />
כמובן, מאוד אפשרי שמהנדסי אמאזון עושים את זה בצורה טובה יותר.</p>
</div>
]]></content:encoded>
	</item>
	<item>
		<title>&#8235;מאת: אורן&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-3130</link>
		<dc:creator>&#8235;אורן&#8236;</dc:creator>		<pubDate>Thu, 31 Jul 2008 18:57:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-3130</guid>
		<description>&#8235;לאמזון יש גם את הנתונים האלו בדבר מורכבות הכתיבה (אם כי הם משתמשים במדדים פשוטים יחסית). 
הנה המדדים לדה וינצ&#039;י:
http://www.amazon.com/Da-Vinci-Code-Dan-Brown/dp/sitb-next/1400079179/ref=sbx_txt#textstats

והנה המדדים לפוקו:
http://www.amazon.com/Foucaults-Pendulum-Umberto-Eco/dp/sitb-next/015603297X/ref=sbx_txt#textstats&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>לאמזון יש גם את הנתונים האלו בדבר מורכבות הכתיבה (אם כי הם משתמשים במדדים פשוטים יחסית).<br />
הנה המדדים לדה וינצ'י:<br />
<a href="http://www.amazon.com/Da-Vinci-Code-Dan-Brown/dp/sitb-next/1400079179/ref=sbx_txt#textstats" rel="nofollow">http://www.amazon.com/Da-Vinci-Code-Dan-Brown/dp/sitb-next/1400079179/ref=sbx_txt#textstats</a></p>
<p>והנה המדדים לפוקו:<br />
<a href="http://www.amazon.com/Foucaults-Pendulum-Umberto-Eco/dp/sitb-next/015603297X/ref=sbx_txt#textstats" rel="nofollow">http://www.amazon.com/Foucaults-Pendulum-Umberto-Eco/dp/sitb-next/015603297X/ref=sbx_txt#textstats</a></p>
</div>
]]></content:encoded>
	</item>
	<item>
		<title>&#8235;מאת: שם&#8236;</title>
		<link>http://www.sciencefriction.net/blog/2008/07/30/135/comment-page-1/#comment-3128</link>
		<dc:creator>&#8235;שם&#8236;</dc:creator>		<pubDate>Thu, 31 Jul 2008 17:32:39 +0000</pubDate>
		<guid isPermaLink="false">http://www.sciencefriction.net/blog/2008/07/30/135/#comment-3128</guid>
		<description>&#8235;מבחינתה של אמזון, הפתרון (מעבר לשיפור המערכת) הוא פשוט, תחת אילו קריטריונים אנשים קונים יותר ספרים ונהנים מהם (מתוך מחשבה שהם משחקים גם לטווח הארוך)? אפשר להציג קריטריונים שונים לקבוצות שונות ולבדוק אחרכך שביעות רצון. כמו כן אפשר בעדיפות נמוכה יותר גם להציע את השיטה המפסידה.

לעצמי, נדמה לי שאיכות הכתיבה חשובה לא פחות מהנושא, הייתי מזדעזע לקבל המלצה לבראון כשאני מזמין את פוקו. ניתן גם יחסית בקלות להעריך את &quot;איכות&quot; הכתיבה (למשל אוצר המילים בספר, תדירות החזרה של מילים נרדפות למול שימוש באותה המילה שוב) וזה יכול להיות פילטר חיוני. כמובן שדרך הפילטר הזה ניתן להעביר ספרות שדומה רעיונית.&#8236;</description> 		<content:encoded><![CDATA[<div style='direction: rtl;'>
<p>מבחינתה של אמזון, הפתרון (מעבר לשיפור המערכת) הוא פשוט, תחת אילו קריטריונים אנשים קונים יותר ספרים ונהנים מהם (מתוך מחשבה שהם משחקים גם לטווח הארוך)? אפשר להציג קריטריונים שונים לקבוצות שונות ולבדוק אחרכך שביעות רצון. כמו כן אפשר בעדיפות נמוכה יותר גם להציע את השיטה המפסידה.</p>
<p>לעצמי, נדמה לי שאיכות הכתיבה חשובה לא פחות מהנושא, הייתי מזדעזע לקבל המלצה לבראון כשאני מזמין את פוקו. ניתן גם יחסית בקלות להעריך את &quot;איכות&quot; הכתיבה (למשל אוצר המילים בספר, תדירות החזרה של מילים נרדפות למול שימוש באותה המילה שוב) וזה יכול להיות פילטר חיוני. כמובן שדרך הפילטר הזה ניתן להעביר ספרות שדומה רעיונית.</p>
</div>
]]></content:encoded>
	</item>
</channel>
</rss>
