IT外包網管服務,目標存儲適合人工智能和機器學習的三個原因

發布者:上海IT外包來源:http://www.751743.tw點擊數:210

藍盟IT小貼士,來嘍!
在能夠學到許多不同的數據源的情況下,采用人工智能和機器學習技術是最有效的。 數據科學家利用這些豐富的數據訓練領域模型。 “五大數據v”(數量、類型、速度、準確性和價值)中,前兩個(數量和類型)最重要。 簡言之,人工智能和機器學習依賴于大量不同的數據(圖像、文本、結構化、半結構化數據)構建有用的模型,提供準確的結果,最終提供商業價值。
對象存儲是一種可擴展的存儲體系結構,尤其適合于支持人工智能和機器學習所需的大量數據。 對象存儲旨在以水平擴展方式實現無限的增長,使公司能夠在需要的位置和時間添加更多節點以增加部署。 由于對象存儲使用單個全局命名空間,因此可以一次在多個地理位置進行此擴展。 另一方面,文件和塊系統通常采用擴展方法。 也就是說,這些平臺通過向單個節點添加計算資源來實現垂直擴展,最終受到約束。 不能部署其他節點來增加計算資源,也不能有效地擴展。
強大而靈活的數據API對于人工智能和機器學習至關重要,并且如上所述使用了各種數據類型。 存儲平臺必須支持用于存儲各種數據的API。 此外,人工智能和機器學習的創新越來越普遍,但仍有相當一部分人工智能和機器學習發生在數據中心和私人云中。 這取決于用例的具體情況(例如,科學研究、醫療等領域最適合私人云)。 這意味著組織需要支持公共云和本地/專用云工作負載的存儲API。
文件和塊存儲平臺支持的API受舊體系結構的限制。 相反,對象存儲使用特定于云平臺的高級API。 此API以應用程序為中心設計,支持多種API,包括版本控制、生命周期管理、加密、對象鎖定和元數據。 您還可以使用新的對象存儲API來支持人工智能和機器學習用例,包括對流數據支持和大型數據集查詢支持。
與API一樣,利用人工智能和機器學習的組織必須利用無限的可定制元數據是非常重要的。 元數據是關于數據的數據,在最基本的層面,是何時何地制作的數據,是誰制作的數據。 但是,元數據可以描述更多的內容.包括: 用戶可以創建任何元數據標記來描述他們想要的屬性。數據科學家為了構建和使用人工智能和機器學習模型,需要大量元數據來查找特定的數據。 隨著向數據添加更多信息,元數據注釋能夠逐漸積累知識。

文件和塊存儲僅支持有限的元數據,如上述基本屬性。 由于文件系統和塊系統沒有快速、無縫的擴展功能,因此如果存儲系統支持大型數據集相關的人工智能和機器學習應用程序的豐富元數據,則這可以極大地影響可擴展性。 然而,目標存儲支持無限數量的完全可定制元數據,使得用于人工智能和機器學習算法的數據搜索更加容易,并且可以從中獲得更好的見解。

文/上海藍盟 IT外包專家

  • 上一篇: 沒有了
    下一篇: 沒有了
  • 分享到:

IT外包
>
400-635-8089
山西快乐10分购买技巧