paint-brush
AI đang chống lại sự độc quyền trong quảng cáo thể thao bằng GPU và máy chủ như thế nàotừ tác giả@hostkey
245 lượt đọc

AI đang chống lại sự độc quyền trong quảng cáo thể thao bằng GPU và máy chủ như thế nào

từ tác giả Hostkey.com6m2024/03/15
Read on Terminal Reader

dài quá đọc không nổi

Công nghệ AI và AR cho phép tùy chỉnh quảng cáo thể thao cho các đối tượng khác nhau trong thời gian thực bằng cách sử dụng giải pháp GPU dựa trên đám mây.
featured image - AI đang chống lại sự độc quyền trong quảng cáo thể thao bằng GPU và máy chủ như thế nào
Hostkey.com HackerNoon profile picture



Thuê máy chủ GPU triển khai ngay lập tức hoặc máy chủ có cấu hình tùy chỉnh với thẻ NVIDIA Tesla H100 / H100 80Gb hoặc RTX A5000 / A4000 cấp chuyên nghiệp. Máy chủ GPU với thẻ trò chơi RTX4090 cũng có sẵn.



Các sự kiện thể thao ngày nay tràn ngập quảng cáo, từ quảng cáo trên màn hình đến logo tĩnh của công ty trên bảng quảng cáo ở sân vận động. Sóng phát sóng trải dài trên nhiều quốc gia với các nhãn hiệu và luật quảng cáo khác nhau. Nhờ những đột phá trong công nghệ AI và AR, có thể tùy chỉnh thông tin hiển thị trực tiếp cho từng khán giả trong quá trình phát sóng trực tiếp một trận đấu.


Quảng cáo tại các đấu trường thể thao ban đầu mang tính tĩnh và dành cho những người tham dự một sự kiện cụ thể ở một thành phố cụ thể. Sau đó, màn hình LED xuất hiện, hiển thị các quảng cáo xen kẽ. Sự phát triển tiếp theo là chèn màn hình xanh vào các điểm trên bảng quảng cáo trong một phần giây, cho phép AI xác định không gian và chèn một văn bản duy nhất.


Ngày nay, bạn có thể thay thế bất cứ thứ gì bằng bất cứ thứ gì. Thách thức là đảm bảo rằng việc thay thế được thực hiện một cách kín đáo và thực tế. Những người chơi chính trong thị trường này sử dụng máy ảnh đặc biệt. Từ các bức ảnh, chúng ta có thể kết luận rằng có những cảm biến chuyên dụng có thể phân biệt thông tin định vị và căn chỉnh. Nghĩa là, các giải pháp phổ biến vẫn có nạng cố định.

Tất cả điều này đòi hỏi sức mạnh tính toán khổng lồ, vì đầu vào và chương trình phát sóng ban đầu được xử lý trực tuyến bằng phần mềm chuyên dụng. Nghĩa là, các máy chủ điện toán được kết nối với camera và cảm biến. Thiết bị này đắt tiền, thị trường đóng cửa và công nghệ cũng đóng cửa. Đây là lúc các máy chủ AI và GPU đám mây ra tay giải cứu.


Đắt tiền, tĩnh và không dành cho tất cả mọi người

HOSTKEY có một khách hàng, một công ty khởi nghiệp tên là Phòng thí nghiệm PTF , công ty đã phát triển công nghệ của riêng mình để triển khai quảng cáo ảo và tích hợp nội dung kỹ thuật số (như thực tế tăng cường) ở chế độ đa khu vực. Và giải pháp của họ hứa hẹn tích hợp quảng cáo liền mạch (và không có xương) trực tiếp vào luồng video.



Cách đây một thời gian, họ đã xem thông tin về HOSTKEY trong cộng đồng Khoa học dữ liệu mở (ODS) và liên hệ với chúng tôi khi họ cần dung lượng đám mây, đánh giá cao dịch vụ, giá cả và dòng tùy chọn sẵn có linh hoạt của chúng tôi.


Mục tiêu của startup rất cao cả, dễ hiểu và khá khả thi:


  1. Để thoát khỏi thiết bị độc quyền đắt tiền và thiết lập phức tạp, hãy chuyển nhiệm vụ đặt quảng cáo và xây dựng khung sang trí tuệ nhân tạo, có tính đến sự chồng chéo của những người và vật thể trong khung.
  2. Bằng cách đó, họ có thể đưa tin về các sự kiện tương đối nhỏ (chẳng hạn như trận đấu ở đấu trường, v.v.) và đưa công nghệ đến với đại chúng.
  3. Cuối cùng, quảng cáo thể thao phải dễ tiếp cận và tương đối ít tốn kém.


Hơn nữa, công ty khởi nghiệp này đã đặt ra mục tiêu đầy tham vọng là vượt qua các giải pháp mà các gã khổng lồ độc quyền đưa ra về tính linh hoạt. Ví dụ: nó có thể hiển thị "quảng cáo ảo" trong khi phát lại và sử dụng các góc từ bất kỳ camera nào, không chỉ từ các góc nhất định.


Làm thế nào nó hoạt động?

Tín hiệu video từ một địa điểm tổ chức sự kiện thể thao có thể được xử lý bằng sức mạnh tính toán không chỉ tại địa điểm đó mà còn trên đám mây. Điều này cho phép phân phối tải linh hoạt và lựa chọn thời điểm áp dụng quảng cáo: trước hoặc trong khi phát sóng, có tính đến các thị trường khác nhau. Ngoài ra, làm việc với các dịch vụ đám mây cho phép bạn sử dụng quảng cáo ở những nơi không thể mang theo máy chủ (và về nguyên tắc thì thuận tiện hơn).


Phân đoạn đối tượng dựa trên kiến trúc mạng thần kinh từ U-Net. Mạng lưới thần kinh chịu trách nhiệm về vị trí của các đối tượng, phát hiện và so sánh các điểm chính. Tuy nhiên, nhiệm vụ này không hề đơn giản nên tất cả các giải pháp và mạng lưới thần kinh phải được làm lại và đào tạo để sử dụng. Điều này đặc biệt khó khăn trong các chương trình phát sóng võ thuật, nơi mà theo đúng nghĩa đen, mọi thứ đều không thể đoán trước được từ góc nhìn của hình ảnh: nguồn sáng, bóng tối, góc máy quay, lưới logo nhà tài trợ chồng lên nhau và cơ thể của các võ sĩ và trọng tài.


Mạng lưới thần kinh không được sử dụng ở mọi nơi. Đôi khi, để giải quyết một vấn đề, chỉ cần thể hiện sự khéo léo và sử dụng các thuật toán đơn giản là đủ. Ví dụ, các thuật toán theo dõi kết hợp các phương pháp mạng thần kinh và hệ phương trình tuyến tính và phi tuyến.


Một phần đáng kể của GPU được phân đoạn. Khả năng phát hiện người và vật thể trong khung càng tốt và việc phân tách chúng theo sơ đồ và loại càng được thực hiện thì khung hình sẽ trông càng tự nhiên và hấp dẫn hơn sau lớp phủ quảng cáo.



Một nhiệm vụ riêng biệt liên quan đến ánh sáng và bóng tối, những nhiệm vụ này phải được tính đến trong thực tế tăng cường khi hiển thị một cảnh. Tính hiện thực của bóng tối là yếu tố then chốt trong việc đánh giá độ “đáng tin cậy” của bức ảnh.



Theo truyền thống, mạng lưới thần kinh thể thao được đào tạo trên các chương trình phát sóng thực tế bằng cách sử dụng dấu hiệu của con người và mô hình tổng hợp. Ở đây, Blender đến giải cứu. Công ty xây dựng các mô hình 3D của võ đài, võ sĩ và trọng tài, đồng thời nhận được cả cảnh quay thực từ các góc vuông và mặt nạ phân đoạn hoặc vị trí của các vật thể và máy ảnh cần thiết cho quá trình huấn luyện. Việc đánh dấu dữ liệu thực tốn nhiều thời gian và tốn kém nhưng có chất lượng cao cho các địa điểm hoặc loại hình thi đấu cụ thể. Dữ liệu tổng hợp ít chân thực hơn sẽ cung cấp nhiều dữ liệu hơn cho việc đào tạo.


Khó khăn chính là địa điểm có thể khác nhau. Trong một trường hợp, nó sẽ là một võ đài quyền anh bằng dây thừng, và trong một trường hợp khác, nó sẽ là một đấu trường có những bức tường lưới, mỗi thứ đều gây khó khăn cho việc phân chia.



Vị trí quảng cáo và theo dõi của camera được xác định bằng cách so sánh đám mây điểm từ mô hình 3D của địa điểm với vị trí thực tế của nó trong khung hình. Điều này cho phép họ xác định vị trí, ngay cả đối với những máy ảnh thủ công có chuyển động hỗn loạn. Sau khi xây dựng lại khung 3D từ 2D (xác định góc yêu cầu), việc hiển thị trực tiếp quảng cáo trong công cụ 3D được thực hiện và kết hợp với khung phát video.



Cảnh 3D phải được xây dựng trước khi chúng tôi bắt đầu công việc và trên thực tế, chúng tôi có một bản sao ảo của địa điểm trong khung, trong đó chúng tôi đưa người và vật thật vào đó thông qua mặt nạ kết xuất. Nghe có vẻ phức tạp nhưng với sức mạnh phù hợp và mạng lưới thần kinh được tối ưu hóa, bạn có thể thực hiện những cú lộn nhào này ngay lập tức và liền mạch.


Tại sao dự án cần tính toán GPU và thuê máy chủ?

PTF Lab có máy chủ riêng (và khả năng sử dụng chúng tại chỗ tại địa điểm thi đấu đã được đề cập trước đó), nhưng sẽ thuận tiện hơn khi sử dụng tài nguyên từ xa vì các kỹ sư của nhà cung cấp dịch vụ chịu trách nhiệm về tính sẵn có của thiết bị và công ty phân bổ ít nguồn lực hơn cho việc này. Và khách hàng bỏ phiếu bằng ví tiền của mình và các lựa chọn tiết kiệm chi phí luôn được ưu tiên hơn.


Ngoài ra, năng lực yêu cầu của công ty không ngừng tăng lên. Nếu cần, có thể dễ dàng mở rộng quy mô chỉ bằng cách thuê thêm (tối đa và bao gồm cả việc thay đổi cấu hình máy chủ cho phù hợp với nhu cầu của công ty).


Trong tương lai, một công ty khởi nghiệp có thể cần rất nhiều dung lượng đám mây. Việc thuê chúng sẽ dễ dàng hơn là mua và bán máy chủ vật lý khi nhu cầu về dịch vụ của chúng tăng giảm.


Các máy chủ và dung lượng GPU cho thuê hiện đang được sử dụng trong các lĩnh vực sau:


  1. Đào tạo mạng lưới thần kinh trên GPU (phân đoạn người và các đối tượng khác trong các chương trình phát sóng thể thao; theo dõi camera ảo 3D).
  2. Sao lưu dữ liệu (video từ các sự kiện, bộ dữ liệu, v.v.).
  3. Quá trình trực tiếp làm việc với quá trình sản xuất đám mây thử nghiệm video, khi phần mềm của công ty được triển khai trên các máy chủ từ xa và tín hiệu video truyền qua nó: đầu vào - không có đồ họa, đầu ra - một hoặc nhiều tín hiệu có đồ họa.


Ngoài sức mạnh tính toán của chúng tôi tại HOSTKEY, công ty khởi nghiệp hiện đang tận dụng các cấu hình GPU sau:


  • AMD Ryzen 9 5950X 3,4GHz (16 lõi)/128Gb/1Tb NVMe SSD+12Tb HDD/2xRTX 3090+PSU]
  • Xeon E3-1230 3,2GHz (4 lõi)/16Gb/2x12Tb HDD/PSU]
  • AMD Ryzen 9 5950X 3,4GHz (16 lõi)/128Gb/1Tb NVMe SSD+12Tb HDD/2xRTX 3090+PSU+Trình giả lập HDMI]
  • AMD Ryzen 9 5950X 3,4GHz (16 lõi)/128Gb/1Tb NVMe SSD+12Tb HDD/2xRTX 3090+PSU]
  • AMD EPYC 7402P 2,8 GHz (24 lõi)/384Gb/2x1,92Tb U3 NVMe SSD/4xRTX 4090+2xPSU]


Như bạn có thể thấy, hầu hết các giải pháp GPU đều được thuê dựa trên RTX4090/3090, nhưng khi yêu cầu về sức mạnh tính toán tăng lên, công ty khởi nghiệp mong muốn có tùy chọn cho các máy chủ có card chuyên nghiệp, mạnh hơn, mang lại độ ổn định tốt hơn khi chạy liên tục 24/24. 7 hoạt động. Trong trường hợp của 3090, thuê chiếc A5000 tương tự thậm chí có thể rẻ hơn.


PTF Lab đang ở giai đoạn đầu của hành trình, nhưng kết quả của nó đã rất hứa hẹn và chúng tôi tại HOSTKEY chúc họ thành công và phát triển, đặc biệt là trong việc vượt qua sự độc quyền của thực tế tăng cường thể thao. David hóm hỉnh luôn đánh bại Goliath độc quyền vụng về.


Nếu bạn có bất kỳ câu hỏi nào dành cho các đồng nghiệp của chúng tôi từ PTF Lab, vui lòng hỏi họ trong phần nhận xét.



Thuê máy chủ GPU triển khai ngay lập tức hoặc máy chủ có cấu hình tùy chỉnh với thẻ NVIDIA Tesla H100 / H100 80Gb hoặc RTX A5000 / A4000 cấp chuyên nghiệp. Máy chủ GPU với thẻ trò chơi RTX4090 cũng có sẵn.