HyperAI
HyperAI
الرئيسية
الأخبار
أحدث الأوراق البحثية
الدروس
مجموعات البيانات
الموسوعة
SOTA
نماذج LLM
لوحة الأداء GPU
الفعاليات
البحث
حول
العربية
HyperAI
HyperAI
Toggle sidebar
البحث في الموقع...
⌘
K
العناوين الرئيسية
SoftBank تستثمر 2 مليار دولار في آينتل ضمن توجهها الاستراتيجي نحو الذكاء الاصطناعي
منذ 3 أيام
OpenAI's o3 يهزم Grok 4 في مواجهة ذكاء اصطناعي على شكل شطرنج بنتيجة 4-0
منذ 7 أيام
AirPods قد تُترجم المحادثات بلحظة مباشرة داخل أذنيك
منذ 9 أيام
DeepSeek وPerplexity يُسقطان انتقادات ماسك لـ Apple حول منع تطبيقات الذكاء الاصطناعي من الصعود لقمة المتجر
منذ 9 أيام
Techcyte وModella AI تعلنان عن شراكة بحثية لدمج منصة الذكاء الاصطناعي التوليدي والمنسق في التشخيص النسيجي
منذ 9 أيام
شراكة استراتيجية بين ماسيف بيو وبروجنوس هيلث لتعزيز وصول المرضى إلى علاجات الأورام
منذ 9 أيام
OM1 توسع شبكة الأعصاب بـ500 ألف مريض جديد، مُعززةً إمكانية توليد أدلة واقعية حقيقية وتسريع الابتكار في مجال الأعصاب
منذ 9 أيام
"Inference Whales" Are Breaking AI Coding Services — And the Industry Is Reeling A surge in extreme usage by a small group of power users — dubbed "inference whales" — is exposing a critical flaw in the business model of AI coding tools. These users, running complex, long-term AI agents, are consuming vast amounts of computational resources, racking up costs in the tens of thousands of dollars while paying just $200 a month. The problem stems from how AI inference works: newer reasoning models break down tasks into multiple steps, drastically increasing token usage. When applied to AI coding platforms, where developers deploy automated agents for extended projects, costs spiral quickly. Many services offer unlimited access for a flat monthly fee — a model now under strain. Anthropic’s Claude Code, for example, saw some users burn through nearly 11 billion tokens — costing almost $35,000 — on a $200/month plan. One top user, Swedish developer Albert Örwall, admitted his workflow could cost Anthropic $500 a day, far exceeding the revenue from his subscription. In response, Anthropic is introducing weekly rate limits starting August 28, forcing heavy users to pay extra for additional capacity. The company also cited policy violations like account sharing and reselling access. Other platforms, like Cursor, have already shifted to usage-based pricing, triggering backlash over poor communication and unexpected bills. “Most users’ costs stayed constant, but the hardest requests cost an order of magnitude more,” Cursor acknowledged. Experts warn the dream of falling inference costs is fading. Newer models are more capable — and more expensive — and users consistently demand the best, not cheaper alternatives. “We’re cognitively greedy creatures,” said TextQL CEO Ethan Ding. “We want the best brain we can get.” With agentic workflows generating exponentially more tokens, even lower per-token prices won’t save the unlimited subscription model. “The math has fundamentally broken,” Ding concluded. As AI coding evolves, the era of free-for-all access may be over — and the real cost of intelligence is finally coming into focus.
منذ 9 أيام
Omnara (YC S25) يُحوّل وكلاء الذكاء الاصطناعي إلى فرق عمل تفاعلية يمكن التحكم بها من أي مكان منصة مراقبة وتحكم مركزيّة لجميع وكلاء الذكاء الاصطناعي — من هاتفك الذكي
منذ 9 أيام
Previous
Next