Por dentro da HBF: Como a High Bandwidth Flash da SanDisk carrega LLMs diretamente no hardware
Principais conclusões
- A High Bandwidth Flash (HBF) é uma nova camada de memória desenvolvida em conjunto pela SanDisk e SK hynix, concebida para se situar entre a High Bandwidth Memory (HBM) e o armazenamento SSD tradicional para resolver o "muro de capacidade de memória" em IA.
- A HBF visa uma largura de banda comparável à da HBM, oferecendo 8 a 16 vezes a capacidade de armazenamento a um custo semelhante, permitindo que os aceleradores de IA mantenham muito mais parâmetros de modelo e dados de contexto diretamente acessíveis ao chip.
- A tecnologia foi formalmente revelada a 25 de fevereiro de 2026, num evento de lançamento conjunto em Milpitas, Califórnia, juntamente com um esforço de normalização global através do Open Compute Project.
- A HBF baseia-se na tecnologia BiCS NAND e CBA (CMOS Bonded Array) existente da SanDisk, com a 1.ª geração já em fase de amostragem e os roteiros da 2.ª e 3.ª gerações a prometerem larguras de banda de leitura superiores a 2 TB/s e 3,2 TB/s, respetivamente.
- A amostragem para clientes está prevista para 2026, com o primeiro hardware de IA esperado a integrar a HBF logo em 2027, posicionando-a como uma tecnologia virada para o futuro, mas ainda não disponível comercialmente.
- A HBF é amplamente citada por analistas como uma das razões estruturais por detrás da enorme subida das ações da SanDisk em 2026, uma vez que poderá abrir um mercado de memória de inferência de IA de vários anos que a NVIDIA e fornecedores concorrentes também estão a tentar abordar com as suas próprias abordagens.
Se tem acompanhado a extraordinária subida das ações da SanDisk em 2026 e vê constantemente o termo HBF mencionado como uma das razões, este artigo explica exatamente o que é a High Bandwidth Flash, como funciona tecnicamente, porque é importante para a inferência de grandes modelos de linguagem e em que ponto se encontra a tecnologia hoje face ao que é apenas um roteiro. Em suma, a HBF é uma nova arquitetura de memória que combina a elevada densidade de armazenamento da memória flash NAND com um desempenho de largura de banda que se aproxima da HBM, a memória ultra-rápida atualmente utilizada nos aceleradores de IA da NVIDIA e AMD. O objetivo é permitir que os chips de IA mantenham muito mais pesos de modelo e dados de contexto de inferência perto do processador, reduzindo as viagens lentas e dispendiosas ao armazenamento externo que causam "atrasos" durante a inferência nos maiores modelos de linguagem atuais. A SanDisk e a SK hynix anunciaram conjuntamente a HBF e um esforço de normalização em 2025 e aceleraram o lançamento com um evento formal em fevereiro de 2026. Embora a engenharia subjacente seja genuinamente inovadora e tenha obtido reconhecimento da indústria, é importante separar o estado real e a curto prazo da tecnologia (amostragem, protótipos, roteiro inicial) de alegações especulativas sobre produtos que ainda não existem.
Se está a acompanhar como avanços como a HBF estão a remodelar as ações de infraestrutura de IA e deseja uma plataforma para agir sobre essa pesquisa com dados de mercado em tempo real, pode criar uma conta gratuita através da WEEX em https://www.weex.com/pt-PT/register?vipCode=vrmi e explorar as suas ferramentas de negociação.
O que é a High Bandwidth Flash (HBF), em termos simples
Para compreender a HBF, ajuda compreender o problema da hierarquia de memória que esta tenta resolver. Os aceleradores de IA como os GPUs dependem de um sistema de memória em camadas: a High Bandwidth Memory (HBM), ultra-rápida mas dispendiosa e com capacidade limitada, situa-se mais perto do chip, enquanto o armazenamento SSD, mais lento mas muito maior e mais barato, situa-se mais longe. À medida que os grandes modelos de linguagem cresceram, e especialmente à medida que as suas janelas de contexto escalaram para a gama de milhões de tokens, a quantidade de dados que estes modelos precisam de manter "perto" do processador durante a inferência explodiu. Quando esses dados não cabem na HBM, os sistemas têm de os recalcular (lento e dispendioso) ou buscá-los em camadas de armazenamento muito mais lentas, o que cria os estrangulamentos de atraso e latência que os utilizadores podem notar em aplicações de IA sob carga pesada.
A HBF foi concebida como uma nova camada que se situa entre estes dois extremos. Construída a partir da tecnologia flash BiCS 3D NAND existente da SanDisk, em vez da DRAM utilizada na HBM, a HBF foi concebida para fornecer largura de banda na mesma gama geral que a HBM, oferecendo cerca de 8 a 16 vezes a capacidade de armazenamento a um custo comparável. Na prática, permite que um chip mantenha fisicamente muito mais parâmetros de modelo e dados de cache chave-valor à mão, abordando o que os engenheiros chamam de "muro de capacidade de memória" da IA, o ponto em que os modelos se tornam limitados não pelo poder de computação bruto, mas pela quantidade de dados relevantes que podem ser mantidos facilmente acessíveis.
| Camada de Memória | Base Tecnológica | Largura de Banda Relativa | Capacidade Relativa | Função Típica |
|---|---|---|---|---|
| HBM (High Bandwidth Memory) | DRAM | Mais elevada | Mais baixa das três | Pesos de modelo ativos, computação em tempo real |
| HBF (High Bandwidth Flash) | NAND flash (BiCS/CBA) | Comparável à HBM (alvo) | 8-16x capacidade da HBM | Contexto de inferência, grandes conjuntos de parâmetros |
| SSD Tradicional | NAND flash | Mais baixa | Mais elevada | Armazenamento em massa, dados frios |
Porque é que a HBF é importante para carregar LLMs diretamente no hardware
A frase "carregar LLMs diretamente no hardware" capta bem a promessa central da HBF. Como a HBF pode conter um volume muito maior de dados enquanto ainda fornece uma largura de banda próxima da HBM, torna-se viável manter significativamente mais parâmetros de um grande modelo de linguagem, ou a sua crescente cache chave-valor durante a inferência de contexto longo, residente em memória rápida em vez de constantemente transferir dados de um lado para o outro a partir de armazenamento distante. De acordo com a investigação arquitetónica que referencia a pilha HBF da SanDisk, uma única configuração HBF que forneça 512 GB de armazenamento de parâmetros a cerca de 1,2 TB/s de largura de banda poderia suportar a inferência em tempo real de grandes modelos de mistura de especialistas e raciocínio a velocidades de geração de tokens significativas, um perfil que os investigadores compararam a níveis de desempenho normalmente associados a clusters de GPU à escala de rack, mas numa pegada muito mais compacta.
Isto é importante porque o estrangulamento atual da indústria limitado pela memória na inferência de transformadores não se deve principalmente à computação bruta, mas sim à quantidade de tempo que um sistema passa a obter dados da memória em vez de realizar cálculos. Como explicou um dos conselheiros da tecnologia, um professor do KAIST envolvido no desenvolvimento original da HBM, as cargas de trabalho de inferência em modelos de transformadores passam mais tempo a mover dados do que a computar sobre eles. A HBF visa diretamente esse estrangulamento de movimento de dados, alargando a largura de banda de um conjunto de memória muito maior e mais barato.
O cronograma da HBF: Do anúncio à normalização
O desenvolvimento da HBF passou por vários marcos concretos e verificáveis em vez de permanecer puramente conceptual, o que é parte da razão pela qual foi levado a sério tanto pela indústria de semicondutores como pelos analistas de ações.
| Data | Marco |
|---|---|
| 2025 (meados do ano) | SanDisk estreia o conceito HBF num evento para investidores; ganha o prémio Best of Show e Most Innovative Technology no Flash Memory Summit 2025 |
| 6 de agosto de 2025 | SanDisk e SK hynix assinam um Memorando de Entendimento para normalizar conjuntamente a especificação HBF |
| Finais de 2025 | Formação de um conselho consultivo técnico; equipas de engenharia em design NAND, design ASIC e embalagem continuam o desenvolvimento de vários anos |
| 25 de fevereiro de 2026 | SanDisk e SK hynix realizam um evento de lançamento conjunto em Milpitas, Califórnia, revelando formalmente a HBF e lançando um fluxo de trabalho de normalização global através do Open Compute Project |
| 2.º semestre de 2026 | Módulos de amostra destinados a clientes selecionados |
| Início de 2027 | Primeiros produtos de hardware de IA esperados a integrar a HBF, com base em relatórios da indústria |
Este cronograma mostra que a HBF está atualmente na fase de amostragem e normalização, ainda não sendo enviada em hardware de IA comercial. Essa distinção é importante para qualquer pessoa que avalie manchetes que sugerem que a tecnologia já está a "eliminar atrasos" em sistemas de produção hoje; a partir de meados de 2026, a HBF permanece uma tecnologia de roteiro de curto prazo apoiada por protótipos funcionais e parcerias sérias da indústria, em vez de um produto amplamente implementado.
Roteiro técnico da HBF: Gerações de desempenho
A SanDisk publicou metas de desempenho viradas para o futuro através de múltiplas gerações de HBF, construídas sobre a sua base CMOS Bonded Array (CBA) NAND.
| Geração | Largura de Banda de Leitura Alvo | Capacidade de Pilha Alvo | Eficiência Energética vs Gen 1 |
|---|---|---|---|
| Gen 1 | Largura de banda inicial da fase de amostragem | Camada de capacidade inicial | Linha de base |
| Gen 2 | Superior a 2 TB/s | Até 1 TB | ~0,8x consumo de energia |
| Gen 3 | Superior a 3,2 TB/s | Até 1,5 TB | ~0,64x consumo de energia |
A SanDisk enquadra este roteiro como uma das suas plataformas de semicondutores mais escaláveis, argumentando que, ao contrário da DRAM, que enfrenta desafios crescentes de escalonamento físico, a HBF beneficia do caminho de escalonamento de densidade mais favorável da NAND através da arquitetura BiCS da SanDisk. Se estas metas geracionais serão atingidas dentro do prazo será um dos sinais técnicos mais claros que os analistas observarão nos próximos dois a três anos.
Como a HBF se compara à abordagem concorrente da NVIDIA
A SanDisk e a SK hynix não são os únicos intervenientes a abordar o muro de capacidade de memória da IA. A NVIDIA, como o comprador dominante de HBM, seguiu a sua própria resposta através do que foi descrito como uma Inference Context Memory Storage Platform (ICMSP), que utiliza SSDs NVMe ligados a DPU, especificamente ligados à unidade de processamento de dados BlueField-4 da NVIDIA, para manter dados de cache chave-valor em excesso da HBM e da DRAM do servidor GPU. Esta abordagem liga-se aos GPUs na plataforma Vera Rubin da NVIDIA através de redes Ethernet de alta velocidade utilizando fotónica, funcionando a 800 Gbps por porta.
| Abordagem | Empresas | Método Principal | Estado |
|---|---|---|---|
| HBF (High Bandwidth Flash) | SanDisk, SK hynix | Pacote de memória baseado em NAND que imita o perfil de largura de banda da HBM | Amostragem 2026, normalização em curso |
| ICMSP | NVIDIA | SSDs NVMe ligados a DPU em rede via Ethernet de alta velocidade | Integrado na plataforma Vera Rubin da NVIDIA |
| PBSSD | Samsung | Camada de armazenamento de IA suportada por flash | Em desenvolvimento |
Notavelmente, a NVIDIA não expressou publicamente interesse direto em adotar a própria HBF, desenvolvendo em vez disso a sua própria solução de camada de armazenamento em rede. Isto é importante para investidores e tecnólogos, pois sinaliza pelo menos duas filosofias arquitetónicas concorrentes para resolver o mesmo problema subjacente: uma (HBF) integra flash diretamente num pacote semelhante a memória perto da matriz de computação, enquanto a outra (ICMSP) depende de redes rápidas para ligar o armazenamento flash externo ao GPU. Qual abordagem, ou combinação de abordagens, se torna o padrão da indústria provavelmente moldará os padrões de procura por NAND versus hardware de rede e DPU nos próximos anos.
Porque é que a HBF está ligada à história das ações da SanDisk
A HBF tornou-se uma das explicações técnicas recorrentes que os analistas citam ao discutir o desempenho dramático do preço das ações da SanDisk em 2026. A lógica liga três coisas: as cargas de trabalho de inferência de IA estão cada vez mais limitadas pela capacidade de memória do que puramente pela computação; a HBF visa diretamente essa limitação com uma solução baseada em NAND que joga com a força de fabrico central da SanDisk; e o negócio NAND existente da SanDisk já está a beneficiar de um ciclo de procura de SSD empresarial impulsionado pela IA separado e mais imediato. Juntos, estes criam uma narrativa onde a SanDisk não está apenas a aproveitar um ciclo de preços NAND de curto prazo, mas pode também estar posicionada no centro de uma mudança arquitetónica de longo prazo na forma como o hardware de IA é construído, assumindo que a HBF alcance uma ampla adoção pela indústria.
Vale a pena ser claro sobre a distinção entre estas duas histórias. A subida das ações da SanDisk até meados de 2026 foi impulsionada esmagadoramente pela procura atual de SSD empresarial e pelos preços dos contratos NAND, uma tendência real e já a monetizar. A HBF, pelo contrário, é uma oportunidade de receita futura ainda na fase de amostragem e normalização, com a integração de hardware comercial não esperada até cerca de 2027, no mínimo. Alguns analistas de mercado projetam uma aceleração significativa da procura relacionada com a HBF apenas por volta de 2030, à medida que as cargas de trabalho de inferência de IA escalam ainda mais em toda a indústria. Investidores e comerciantes devem tratar a HBF como um fator de opcionalidade de longo prazo sobreposto à história de preços NAND de curto prazo da SanDisk, já comprovada, e não como um motor de receita atual.
Riscos e questões em aberto em torno da HBF
Várias incertezas genuínas permanecem antes que a HBF se torne um componente convencional da infraestrutura de IA. A normalização através do Open Compute Project leva tempo e requer uma ampla adesão da indústria para além da SanDisk e da SK hynix; sem uma adoção mais ampla por parte dos fabricantes de GPU e integradores de sistemas, a HBF corre o risco de permanecer uma solução de nicho. A falta de compromisso público da NVIDIA com a HBF, dada a sua posição dominante no design de aceleradores de IA, é uma questão em aberto significativa, uma vez que a sua própria abordagem ICMSP representa uma arquitetura concorrente que poderia capturar a mesma oportunidade de mercado através de um caminho técnico diferente. A complexidade de fabrico também não é trivial; a HBF combina empilhamento avançado 3D NAND, embalagem inovadora e técnicas de colagem de wafers que precisam de escalar para produção de alto volume de forma fiável, um processo no qual as equipas de engenharia têm trabalhado alegadamente há quase dois anos, mesmo antes da revelação pública. Finalmente, como qualquer tecnologia de semicondutores emergente, o desempenho real, o rendimento e os números de custo alcançados na produção em massa podem diferir das metas do roteiro geracional que a SanDisk publicou.
Considerações finais
A HBF representa uma abordagem genuinamente inovadora a um dos estrangulamentos técnicos mais prementes da infraestrutura de IA: como manter dados relevantes suficientes perto o suficiente do processador para evitar o atraso criado pelos limites de capacidade de memória atuais. Ao misturar a alta densidade da memória flash NAND com um desempenho de largura de banda que se aproxima da HBM, a SanDisk e a SK hynix estão a visar um problema que se torna mais urgente à medida que os modelos de linguagem escalam para janelas de contexto cada vez mais longas e cargas de trabalho de raciocínio mais complexas. A tecnologia passou de conceito a protótipo funcional para um lançamento conjunto formal com um impulso de normalização real em pouco menos de dois anos, o que é um ritmo rápido para os padrões da indústria de semicondutores. Dito isto, a HBF permanece pré-comercial a partir de meados de 2026, com a amostragem de clientes prevista para o final deste ano e o primeiro hardware de IA integrado não esperado até 2027. Para qualquer pessoa que avalie a história de armazenamento de IA mais ampla da SanDisk, a HBF é melhor compreendida como uma aposta de longo prazo credível e bem dotada de recursos, sobreposta ao negócio de NAND e SSD empresarial da empresa, já comprovado e atualmente a monetizar.
Se este tipo de análise profunda sobre a tecnologia que impulsiona as ações de infraestrutura de IA lhe for útil, pode colocar essa pesquisa em ação inscrevendo-se através da WEEX em https://www.weex.com/pt-PT/register?vipCode=vrmi e explorando a sua plataforma de negociação.
Perguntas frequentes
1. O que é a High Bandwidth Flash (HBF) e como é diferente da HBM?
A HBF é uma nova tecnologia de memória construída sobre flash NAND em vez de DRAM, concebida para fornecer largura de banda comparável à High Bandwidth Memory (HBM), oferecendo 8 a 16 vezes mais capacidade de armazenamento a um custo semelhante. A HBM permanece mais rápida e com menor latência, mas a HBF permite que os sistemas de IA mantenham muito mais dados, como parâmetros de modelo ou contexto de inferência, acessíveis sem os limites de custo e capacidade da memória puramente baseada em DRAM.
2. Quando é que a HBF estará disponível em produtos de hardware de IA reais?
A partir de meados de 2026, a HBF está na fase de amostragem e normalização. Os módulos de amostra destinam-se a ser lançados para clientes selecionados no segundo semestre de 2026, com os primeiros produtos de hardware de IA esperados a integrar a HBF a partir do início de 2027, de acordo com relatórios da indústria.
3. A HBF substitui a HBM em chips de IA como os GPUs da NVIDIA?
Não. A HBF foi concebida para complementar a HBM, não para a substituir. Destina-se a atuar como uma camada de memória adicional que se situa entre a HBM ultra-rápida e o armazenamento SSD tradicional, muito mais lento, lidando com dados de grande capacidade, como o contexto de inferência, que não necessitam da velocidade absolutamente mais rápida da HBM, mas ainda necessitam de um desempenho muito melhor do que o armazenamento padrão.
4. Que empresas estão a desenvolver a tecnologia HBF?
A SanDisk e a SK hynix estão a desenvolver conjuntamente a HBF e assinaram um Memorando de Entendimento em agosto de 2025 para normalizar a sua especificação. Lançaram formalmente a tecnologia num evento conjunto em fevereiro de 2026 e estão a trabalhar com o Open Compute Project na normalização em toda a indústria, enquanto concorrentes como a NVIDIA e a Samsung estão a seguir as suas próprias abordagens alternativas ao mesmo estrangulamento de memória.
5. Como é que a HBF está ligada à subida do preço das ações da SanDisk em 2026?
Os analistas citam a HBF como um motor de crescimento de longo prazo, virado para o futuro, sobreposto à história de preços NAND e SSD empresarial impulsionada pela IA mais imediata da SanDisk, que tem sido o principal fator de curto prazo por detrás da subida das ações. A HBF representa uma opcionalidade futura ligada a um potencial novo mercado de arquitetura de memória de IA, em vez de uma fonte atual de receita, uma vez que não se esperam produtos comerciais antes de 2027.
Aviso legal
Este artigo destina-se apenas a fins informativos e educativos e não constitui aconselhamento financeiro, de investimento, jurídico ou técnico. As informações sobre a tecnologia HBF, cronogramas de produtos e declarações da empresa refletem dados publicamente disponíveis a partir de meados de 2026 e podem mudar à medida que a tecnologia se desenvolve; a disponibilidade comercial, as especificações de desempenho e os cronogramas de adoção podem diferir materialmente dos roteiros atuais. As referências ao desempenho das ações da SanDisk são ilustrativas e não constituem uma recomendação para comprar ou vender qualquer título. Realize sempre a sua própria pesquisa independente e consulte um consultor financeiro licenciado antes de tomar quaisquer decisões de investimento. Nem o autor nem o editor são responsáveis por quaisquer perdas resultantes da confiança neste conteúdo.



