報告草稿1已完成!
經過數週的糾纏,報告初稿終於完成了。 它至少一半是點形式的,但是所有主意都在那裡。 該草稿已發送給Dr Kwan以徵求意見。 現在,我可以花更多時間促進YouFind移植模型供他們網站使用。
再與讚助公司人員會面
在過去的兩周中,我一直在寫報告草稿。
除了交付產品外,與YouFind一起要做的一件事就是與他們一起評估機器學習模型。 因此,今天我與Vincent討論了一種比較初始的線性模型和機器學習模型的客觀方法。 我們已經同意將使用Spearman的排名系數作為比較模型的指標。
Vincent還告訴我他們想在網站內容中使用新模型來吸引客戶。 種用法是超出討論過的範圍。但我很樂意在這方面幫助他們,因為這證明了他們對我工作的肯定。
與讚助公司人員會面
今天,我在會見了讚助公司的人員。 我向Vincent和Raymond展示了專案的進度以及機器學習算法的初步結果。 我們同意過濾掉某些低質量的數據,以查看結果是否可以改善。 我們還談到了從長遠如何提高模型的準確性以及使用模型時的程序。
與Academic Supervisor會面
我昨天才與Academic Supervisor關博士進行會議,他提議今天早上會面。 我要感謝他的熱誠。我不介意一大早爬下床坐車半小時到會面場地。
我告訴他有關r^2讓我有些失望的問題。他鼓勵我說r^2不是專案中最重要的事情。重要的是過程和論據/邏輯思維。 我放心了些。但是,我確實想為在專案中花了很多時間的讚助人做點很棒的事情。因此,我確實希望儘管r^2相對較低,但我仍然可以開發出對YouFind有用的一個工具。
機器學習初步完成
機器學習的數據準備需要幾小時才完成。 識別需要添加到數據集的search term特徵是其中一項任務。這需要我查看具有最高和最低平均評分的search term,並識別其中一些可識別的共同特徵,並編寫程式以在數據集中創建此類feature。我只能以目測的方式來做到這一點,需要花費大量時間和精力!
在這一輪之後,我從模型中得到的r^2並不很高。 但是,r^2不是度量成果的唯一方法。 較高的r^2可以增強我的信心,但真正重要的是YouFind是否可以依靠算法生成的列表來提高效率。 我期待著這一部分。
現在,我必須與academic supervisor進行討論,以確保我做正確的事。我會明天見他。
Planning Review終於提交了!
我的Planning Review其實於去年12月中已完成。YouFind和Academic Supervior當時都簽署了TOR的相應部分。由於UOS從來沒有給我一個Planning Review確實的死綫,所以直到昨天我還沒有將Planning Review上載到Canvas。但是,關博士已於12月非正式地收到了Planning Review,此後我們已經天我還沒有將Planning Review上載到Canvas。但是,關博士已於12月非正式地收到了Planning Review,此後我們已經會面了幾次。
我多次問香港辦公室有關死綫的問題。由於從未設置過,辦公室沒有強迫我正式提交該文件。最後,我和香港辦公室都對談話感到厭倦:-),因此我們同意我今天提交。我添加到Planning Review中的唯一一句話是關於大流行病如何影響數據收集過程的一段。不幸的是,我們現在比原計劃晚了4週!我確實希望,最終UOS在本月晚些時候的會議中給出的死綫將有足夠的時間給我很好地完成該專案!
Keyword Filtering Project Update to SEO Team (Mar 12)
Dear SEO Team,
As of the Tuesday deadline all of you have finished all the questionnaires. Thank you very much for your support!
It is now time for me to dig into the data and hopefully produce a machine learning model that can identify the high value search terms to help you in your work. I will come back to you later for the results.
Again, thank you!
Victor
所有問卷均已填寫!
截至3月10日晚上,所有問卷均已填寫!
該一部分是本專案一個非常漫長的旅程。 原定計劃問卷可在一個月內完成。 由於YouFind為應對新型冠狀病毒傳播的工作安排,現在已經花費了兩個多月的時間。
機器學習的過程從現在開始! 希望數據的質累素可满足機器學習過程的需要!
Keyword Filtering Project Update to SEO Team (Mar 4)
Dear SEO Team,
I checked the questionnaires completed and I found that only a few of you have completed the batch that was due last Friday. I understand that the number of questionnaires released last week is a but higher than the previous weeks. In any case, please complete the batch as soon as possible.
The final batch is originally scheduled to be due this Friday. Looking at the progress I think it makes sense to give you a bit more time so that we will have better response quality. I am extending the deadline to next Tuesday (March 10) for the final batch.
If you run into any problems, please let me know.
Thank you very much!
Keyword Filtering Project Update to SEO Team (Feb 26)
Dear SEO Team,
Most of you have already completed the first 5 questionnaires of Batch 2, and many of you have also done part of Batch 3. Thank you very much!
As mentioned last week, please finish the rest of Batch 2 and the whole Batch 3 by Friday end of day (February 28).
Batch 4, the final batch, is now released. Please complete the batch by next week on Friday (March 6). By then this stage will be complete.
If you run into any problems, please let me know.
Thank you very much!
Keyword Filtering Project Update to SEO Team (Feb 20)
Dear SEO Team,
I notice that some of you still have not started with Batch 2. If you are one of them, please start now and finish the 5 questionnaires (first 5 of Batch 2) by end of tomorrow.
The rest of Batch 2 and Batch 3 are now open. Please finish them by end of next week. The final batch, Batch 4, will be open next week.
As always, if you encounter any problems, please let me know.
Thank you very much!
再次到訪YouFind
今天,我再次到訪了YouFind,與沒有參加啟動會議的SEO團隊成員進行了交談。 會議的目的是確保他們了解本專案,以便他們能夠為專案提供最佳的數據。 我為他們的熱情感到驚訝。這使我更有信心從團隊那裡收集到高質量的數據。
