<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.2.2h" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/">
<channel>
	<title>&#8235;תגובות על: מוזיקה, תעתיק (טרנסליטרציה) ומערכות לומדות</title>
	<link>http://www.sciencefriction.net/blog/2007/10/02/29/</link>
	<description>&#8235;מעניין. אולי זה אפילו נכון.</description> 	<pubDate>Thu, 20 Nov 2008 08:24:31 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.2.2h</generator>
	<language>he</language>
	<item>
		<title>&#8235;מאת: askzeev</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-2377</link>
		<author>&#8235;askzeev</author>  		<pubDate>Thu, 03 Jul 2008 19:30:15 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-2377</guid>
		<description>&#8235;אבידות ומציאות:
מחפש עבורי ++ פתרון יהודי-יעוד
לקרוא באותיות אנגליות את שמות שירים באייפוד שהועלו בעברית והחשוד מסרב להסגיר ידיעותיו בשפות
יבורך המוצא ויקבל קרדיט בהפצה מסיבית של פתרון</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>אבידות ומציאות:<br />
מחפש עבורי ++ פתרון יהודי-יעוד<br />
לקרוא באותיות אנגליות את שמות שירים באייפוד שהועלו בעברית והחשוד מסרב להסגיר ידיעותיו בשפות<br />
יבורך המוצא ויקבל קרדיט בהפצה מסיבית של פתרון</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: מבצע סבתא וטרנסליטרציה</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-2247</link>
		<author>&#8235;מבצע סבתא וטרנסליטרציה</author>  		<pubDate>Tue, 24 Jun 2008 23:55:23 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-2247</guid>
		<description>&#8235;[...] על טרנסליטרציה במוזיקה תעתיק ומערכות לומדות. SHARETHIS.addEntry({ title: "מבצע סבתא וטרנסליטרציה", url: [...]</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>[&#8230;] על טרנסליטרציה במוזיקה תעתיק ומערכות לומדות. SHARETHIS.addEntry({ title: "מבצע סבתא וטרנסליטרציה", url: [&#8230;]</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: הילל</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-46</link>
		<author>&#8235;הילל</author>  		<pubDate>Fri, 12 Oct 2007 08:44:10 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-46</guid>
		<description>&#8235;אני משתמש  ב-Win98, כך שיכול להיות שזו הבעיה</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>אני משתמש  ב-Win98, כך שיכול להיות שזו הבעיה</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: יואב</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-45</link>
		<author>&#8235;יואב</author>  		<pubDate>Tue, 09 Oct 2007 09:01:28 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-45</guid>
		<description>&#8235;לא צריך להיות נבזי במיוחד כדי לקבל תוצאות מעניינות -- נסה 'הד', 'בד', 'היברו'. :( 

ולעניין ההפרדה -- טלפון היא בדיוק אחת המילים שנמצאות בראייתי על גבול הבלתי ניתן להפרדה במקרה של הבעיה שאני מנסה לפתור, שכן מבחינה צלילית המילה מתאימה גם לכאן וגם לכאן. מצד שני 'טלפונים' נשמע כבר עברי, ו'טלפונס' בלעז. 

ולגבי ההפרדה בבעיית התעתיק -- אחדד את הדוגמה של mayer (שאני בהחלט יכול להבין מדוע היא לא עברה טוב) -- ההגיה העברית הנכונה של mayer היא מאיר, ולא מאייר, (ראה http://www.cs.bgu.ac.il/~gmayer). ואתן גם דוגמה נוספת, ויותר בעייתית: איך תתעתק 'קווין'? בתחום המוזיקה, מחוץ להקשר, בטוח תטעה מון פעמים (אלא אם יש לך "מודל משתמש" ואתה יודע משהו על העדפותיו המוזיקליות, אבל זה כבר ממש לא בלי הקשר).</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>לא צריך להיות נבזי במיוחד כדי לקבל תוצאות מעניינות &#8212; נסה 'הד', 'בד', 'היברו'. <img src='http://www.sciencefriction.net/blog/wp-includes/images/smilies/icon_sad.gif' alt=':(' class='wp-smiley' /> </p>
<p>ולעניין ההפרדה &#8212; טלפון היא בדיוק אחת המילים שנמצאות בראייתי על גבול הבלתי ניתן להפרדה במקרה של הבעיה שאני מנסה לפתור, שכן מבחינה צלילית המילה מתאימה גם לכאן וגם לכאן. מצד שני 'טלפונים' נשמע כבר עברי, ו'טלפונס' בלעז. </p>
<p>ולגבי ההפרדה בבעיית התעתיק &#8212; אחדד את הדוגמה של mayer (שאני בהחלט יכול להבין מדוע היא לא עברה טוב) &#8212; ההגיה העברית הנכונה של mayer היא מאיר, ולא מאייר, (ראה <a href="http://www.cs.bgu.ac.il/~gmayer" rel="nofollow">http://www.cs.bgu.ac.il/~gmayer</a>). ואתן גם דוגמה נוספת, ויותר בעייתית: איך תתעתק 'קווין'? בתחום המוזיקה, מחוץ להקשר, בטוח תטעה מון פעמים (אלא אם יש לך "מודל משתמש" ואתה יודע משהו על העדפותיו המוזיקליות, אבל זה כבר ממש לא בלי הקשר).</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: אורן</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-44</link>
		<author>&#8235;אורן</author>  		<pubDate>Tue, 09 Oct 2007 06:36:44 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-44</guid>
		<description>&#8235;יואב- 
הסמיילים כאן זו אחתהבעיות של התמיכה בעברית - הם תמיד יוצאים הפוכים. 

שיחקתי קצת עם האפליקציה שלך. חמוד מאוד. כמובן שניסיתי להיות נבזי עד כמה שאפשר ולכן  ניסיתי את המילים {טלפון, טלוויזיה, טלביזיה, מוניטור, אחשדרפנים [מילה פרסית, מופיעה פעם אחת בתנך], מניאק, ספיקר וספיקרים). יצא מעניין  :-(

אבל לגוף העניין זה נכון שבראייה רחבה בעיית התעתיק לא ניתנת להפרדה, אבל מה שזה אומר זה שלא ניתן יהיה לצמצם את הטעות כראות עינינו גם אם נוסיף עוד ועוד דוגמאות, אלא אם קבוצת השמות (או הזוגות) היא סופית. אם הקבוצה סופית אז הבעיה לא כל כך מעניינת, אבל גם אם היא לא סופית ניתן יהיה ללמוד בצורה סבירה (זו תחושה בקשר לבעיה הזו ספציפית, או שאני טועה כאן). בכל אופן - הייתי מכניס אילוץ של קומפקטיות, ואני אנסח אותו בחופשיות ללא מחשבה מעמיקה - "בתיעתוק ללא הקשר בחר באופציה הקצרה" וכך מאיר יהפוך לmeir ורוסו יהפוך ל-ruso (נניח).
זה גם נראה לי סביר אינטואיטיבית, כלומא אולי זה מה שאנחנו עושים כישראלים - למה נראה לך שרוב האנשים יבחרו ב-meir על פני mayer?
(בעצם, אולי כי 'מאיר' שכיח יותר מ'מָאייר').</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>יואב-<br />
הסמיילים כאן זו אחתהבעיות של התמיכה בעברית - הם תמיד יוצאים הפוכים. </p>
<p>שיחקתי קצת עם האפליקציה שלך. חמוד מאוד. כמובן שניסיתי להיות נבזי עד כמה שאפשר ולכן  ניסיתי את המילים {טלפון, טלוויזיה, טלביזיה, מוניטור, אחשדרפנים [מילה פרסית, מופיעה פעם אחת בתנך], מניאק, ספיקר וספיקרים). יצא מעניין  <img src='http://www.sciencefriction.net/blog/wp-includes/images/smilies/icon_sad.gif' alt=':-(' class='wp-smiley' /> </p>
<p>אבל לגוף העניין זה נכון שבראייה רחבה בעיית התעתיק לא ניתנת להפרדה, אבל מה שזה אומר זה שלא ניתן יהיה לצמצם את הטעות כראות עינינו גם אם נוסיף עוד ועוד דוגמאות, אלא אם קבוצת השמות (או הזוגות) היא סופית. אם הקבוצה סופית אז הבעיה לא כל כך מעניינת, אבל גם אם היא לא סופית ניתן יהיה ללמוד בצורה סבירה (זו תחושה בקשר לבעיה הזו ספציפית, או שאני טועה כאן). בכל אופן - הייתי מכניס אילוץ של קומפקטיות, ואני אנסח אותו בחופשיות ללא מחשבה מעמיקה - "בתיעתוק ללא הקשר בחר באופציה הקצרה" וכך מאיר יהפוך לmeir ורוסו יהפוך ל-ruso (נניח).<br />
זה גם נראה לי סביר אינטואיטיבית, כלומא אולי זה מה שאנחנו עושים כישראלים - למה נראה לך שרוב האנשים יבחרו ב-meir על פני mayer?<br />
(בעצם, אולי כי 'מאיר' שכיח יותר מ'מָאייר').</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: יואב</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-43</link>
		<author>&#8235;יואב</author>  		<pubDate>Tue, 09 Oct 2007 01:35:49 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-43</guid>
		<description>&#8235;הסמיילי אמור היה לחייך ויצא עצוב. חבל.</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>הסמיילי אמור היה לחייך ויצא עצוב. חבל.</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: יואב</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-42</link>
		<author>&#8235;יואב</author>  		<pubDate>Tue, 09 Oct 2007 01:33:03 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-42</guid>
		<description>&#8235;היי, יופי של פוסט, וגם על נושא שבדיוק חזרתי קצת להתעסק בו שוב. 

אז קודם קודם מהאופטופיק -- משחקי הרשת של ואן-אהן (והא לך דילמת תעתיק): משחק תיעתוק לעברית לא יעבוד, מהסיבה הפשוטה שהמשחקים האלו משעממים רצח. זה אולי עובד איכשהו על כמה אמריקאים תמוהים/משועממים, אבל קשה לי לדמיין את זה ממריא עם קהל ישראלי. :)

עכשיו, לעצם העניין: 

אני חושב שגם ב-PAC כדי שלמידה תתכנס צריך שהקבוצות יהיו ניתנות להפרדה. כשזה נוגע לתעתיק (או שפה בכלל, אבל נעזוב את זה כרגע) הדרישה הזו לא מתקיימת -- מחוץ להקשר גם Mayer וגם Meir הם תעתוקים טובים עבור 'מאיר'. בתוך הקשר, אני מכיר מעט מאד אנשים (אממ.. בעצם אחד) שיאייתו באופן הראשון. 

להשתמש בCDDB עבור כמאגר ללימוד תיעתוק שמות זה יופי של רעיון! (אגב, באופן דומה, מה לגבי כתוביות פיראטיות לסרטים כקורפוס מקבילי ללמוד תרגום?)

ו - דבר אחרון -- שיחקתי פעם קצת עם נושא קרוב קרוב רחוק -- כיצד לזהות מילים לועזיות בטקסט עברי. כלומר, המילים 'אדפטיישן' או 'טרנליטרייט' או 'אליינטמט' הן בלי ספק לא בעברית. 'כלב', 'חתול', 'טרנסליטרציה' הן כן. משהו בצלילים. האם ניתן לכתוב תוכנה שתדע להבחין בכך? ניסיתי. אחת הגרסאות היותר מוקדמות (מודל לא משהו..) נמצאת ברשת: http://www.ygyg.net/cgi-bin/decider_cgi.pl?

(הקידוד של העמוד אמור להיות cp1255). כולכם מוזמנים לשחק.</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>היי, יופי של פוסט, וגם על נושא שבדיוק חזרתי קצת להתעסק בו שוב. </p>
<p>אז קודם קודם מהאופטופיק &#8212; משחקי הרשת של ואן-אהן (והא לך דילמת תעתיק): משחק תיעתוק לעברית לא יעבוד, מהסיבה הפשוטה שהמשחקים האלו משעממים רצח. זה אולי עובד איכשהו על כמה אמריקאים תמוהים/משועממים, אבל קשה לי לדמיין את זה ממריא עם קהל ישראלי. <img src='http://www.sciencefriction.net/blog/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>עכשיו, לעצם העניין: </p>
<p>אני חושב שגם ב-PAC כדי שלמידה תתכנס צריך שהקבוצות יהיו ניתנות להפרדה. כשזה נוגע לתעתיק (או שפה בכלל, אבל נעזוב את זה כרגע) הדרישה הזו לא מתקיימת &#8212; מחוץ להקשר גם Mayer וגם Meir הם תעתוקים טובים עבור 'מאיר'. בתוך הקשר, אני מכיר מעט מאד אנשים (אממ.. בעצם אחד) שיאייתו באופן הראשון. </p>
<p>להשתמש בCDDB עבור כמאגר ללימוד תיעתוק שמות זה יופי של רעיון! (אגב, באופן דומה, מה לגבי כתוביות פיראטיות לסרטים כקורפוס מקבילי ללמוד תרגום?)</p>
<p>ו - דבר אחרון &#8212; שיחקתי פעם קצת עם נושא קרוב קרוב רחוק &#8212; כיצד לזהות מילים לועזיות בטקסט עברי. כלומר, המילים 'אדפטיישן' או 'טרנליטרייט' או 'אליינטמט' הן בלי ספק לא בעברית. 'כלב', 'חתול', 'טרנסליטרציה' הן כן. משהו בצלילים. האם ניתן לכתוב תוכנה שתדע להבחין בכך? ניסיתי. אחת הגרסאות היותר מוקדמות (מודל לא משהו..) נמצאת ברשת: <a href="http://www.ygyg.net/cgi-bin/decider_cgi.pl?" rel="nofollow">http://www.ygyg.net/cgi-bin/decider_cgi.pl?</a></p>
<p>(הקידוד של העמוד אמור להיות cp1255). כולכם מוזמנים לשחק.</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: אורן</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-41</link>
		<author>&#8235;אורן</author>  		<pubDate>Sun, 07 Oct 2007 09:37:17 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-41</guid>
		<description>&#8235;הילל - 
דווקא האקספלורר עושה קצת בעיות. באיזו גירסה של FF אתה משתמש? גם אני משתמש בFF (מוזילה 5.0 Gecko/20070914 Firefox/2.0.0.7) ואצלי זה נראה בסדר. אני אשמח לבדוק ולראות אם אוכל לסדר את התאימות.

ד.ט - 
אתה צודק בערך במליון אחוז וזו בדיוק הבעיה וזה גם האתגר - מה גם שלא שואפים למאה אחוזי הצלחה. 
לגבי זיהוי שפת הכתיבה - זה לא מסובך במיוחד ואפשר לעשות את זה בדיוק די מרשים (בהינתן שהשם מופיע כחלק מטקסט). 
לגבי הרוסו האיטלקי והצרפתי - זו אכן בעיה, אבל נראה לי שיש  דרכים להתגבר גם עליה בצורה מספקת.
וסתם -  נראה לי  שרוֹסוֹ האיטלקי (במילעיל ומשיכה של הס') ורוּסוֹ הצרפתי (מילרע) מגיעים מאותה מילה  - אדום/אדמוני (יעני מין קוגנטים) - את שניהם הייתי "מתעתק" ל-ג'ינג'י. :-(</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>הילל -<br />
דווקא האקספלורר עושה קצת בעיות. באיזו גירסה של FF אתה משתמש? גם אני משתמש בFF (מוזילה 5.0 Gecko/20070914 Firefox/2.0.0.7) ואצלי זה נראה בסדר. אני אשמח לבדוק ולראות אם אוכל לסדר את התאימות.</p>
<p>ד.ט -<br />
אתה צודק בערך במליון אחוז וזו בדיוק הבעיה וזה גם האתגר - מה גם שלא שואפים למאה אחוזי הצלחה.<br />
לגבי זיהוי שפת הכתיבה - זה לא מסובך במיוחד ואפשר לעשות את זה בדיוק די מרשים (בהינתן שהשם מופיע כחלק מטקסט).<br />
לגבי הרוסו האיטלקי והצרפתי - זו אכן בעיה, אבל נראה לי שיש  דרכים להתגבר גם עליה בצורה מספקת.<br />
וסתם -  נראה לי  שרוֹסוֹ האיטלקי (במילעיל ומשיכה של הס') ורוּסוֹ הצרפתי (מילרע) מגיעים מאותה מילה  - אדום/אדמוני (יעני מין קוגנטים) - את שניהם הייתי "מתעתק" ל-ג'ינג'י. <img src='http://www.sciencefriction.net/blog/wp-includes/images/smilies/icon_sad.gif' alt=':-(' class='wp-smiley' /> </p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: ד.ט</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-40</link>
		<author>&#8235;ד.ט</author>  		<pubDate>Sun, 07 Oct 2007 07:57:40 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-40</guid>
		<description>&#8235;ודבר אחרון, השאלות מה מקור השם ואיך הוגים אותו כרוכות זו בזו. 

למשל, ייתכן ששם על משקל "רוסו" ייהגה אחרת אם הוא איטלקי (Rosso) או צרפתי (רוּסוֹ). בשביל להחליט איך להגות צריך להחליט מה השפה, ולהיפך.

יאללה, גם לי יש מה לעשות.</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>ודבר אחרון, השאלות מה מקור השם ואיך הוגים אותו כרוכות זו בזו. </p>
<p>למשל, ייתכן ששם על משקל "רוסו" ייהגה אחרת אם הוא איטלקי (Rosso) או צרפתי (רוּסוֹ). בשביל להחליט איך להגות צריך להחליט מה השפה, ולהיפך.</p>
<p>יאללה, גם לי יש מה לעשות.</p>
</div>
</div>]]></content:encoded>	</item>
	<item>
		<title>&#8235;מאת: ד.ט</title>
		<link>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-38</link>
		<author>&#8235;ד.ט</author>  		<pubDate>Sun, 07 Oct 2007 07:46:16 +0000</pubDate>
		<guid>http://www.sciencefriction.net/blog/2007/10/02/29/#comment-38</guid>
		<description>&#8235;מה שניסיתי לומר, שהאדם מסתמך יותר על היכרות מוקדמת עם השם מאשר על כל דבר אחר, כשהוא בא לקבוע את ההגייה. 

ראה את זוגות השמות העבריים "נדב" ו"נגב", "נגר" ו"נגב", "צור" ו"דור". מלבד היכרות מוקדמת, איך אפשר לדעת שנדב זה NADAV ואילו נגב זה NEGEV? (מה שכן, צורות כמו NADV שאפשריות תאורטית, נפסלות אוטומטית אם מזהים שמדובר בשם עברי).</description> 		<content:encoded><![CDATA[<div dir="rtl"><div style='direction: rtl;'>
<p>מה שניסיתי לומר, שהאדם מסתמך יותר על היכרות מוקדמת עם השם מאשר על כל דבר אחר, כשהוא בא לקבוע את ההגייה. </p>
<p>ראה את זוגות השמות העבריים "נדב" ו"נגב", "נגר" ו"נגב", "צור" ו"דור". מלבד היכרות מוקדמת, איך אפשר לדעת שנדב זה NADAV ואילו נגב זה NEGEV? (מה שכן, צורות כמו NADV שאפשריות תאורטית, נפסלות אוטומטית אם מזהים שמדובר בשם עברי).</p>
</div>
</div>]]></content:encoded>	</item>
</channel>
</rss>
